Evaluer 

les 

apprentissages 

Les apports de la psychologie cognitive 


Jacques Grégoire (Éd.) 




perspectives 

éducation 


en 


L a place de plus en plus grande 

accordée aujourd'hui à l'évaluation 
formative et à l'évaluation diagnostique 
modifie en profondeur les besoins des 
praticiens. Dans ce cadre, l'important est 
moins d'enregistrer la réussite ou l'échec 
que de comprendre ce qui est sous-jacent 
aux performances observées. Quelles 
démarches l'élève a-t-il suivies pour 
arriver à la réponse qu'il nous propose? 
A-t-il compris le sens de la procédure 
utilisée? Où a-t-il rencontré des 
difficultés? Comment a-t-il fait face à 
ces difficultés? Répondre à ces questions 
est essentiel pour pouvoir intervenir 
de manière efficiente. 

D es réponses appropriées 

se trouvent dans cet ouvrage, 
fruit d'une collaboration de spécialistes 
de la psychologie cognitive 
et de l'évaluation. 

L'ensemble est organisé en quatre grands 
thèmes: 

1. l'évaluation des apprentissages 
mathématiques; 

2. l'évaluation de la lecture; 

3. la place de la métacognition dans 
l'évaluation; 

4. les implications psychométriques des 
nouveaux modèles d’évaluation. 


Avec les contributions de: 

J. Bideaud, Université Charles de Gaulle-Lille 3. 
J.-P. Fischer. IUFM de Lorraine. 

J. Grégoire, Université Catholique de Louvain. 
Louvain-la Neuve. 

C. Jourdain, Université de Bourgogne. Dijon. 

D. Laveault, Université d'Ottawa. 

B. Leté, INRP Paris. 

J. Retschitzki, Université de Fribourg. 

G. Scallon, Université Laval. Québec. 

J.-L. Wolfs, Université Libre de Bruxelles. 

D. Zagar, Université de Bourgogne. Dijon. 


ISBN : 2-8041-2237-9 


il iiiii 

uni i 

9 782804 

122379 


GREEVA 
B 922 





















en 


^perspectives 

éducation 


Collection dirigée par 

Philippe Jonnaert, Sherbrooke 


Comité scientifique international 

Dan Baba Tahirou, Niamey, Jean-Marie De Ketele, Louvain-la-Neuve; 
Maurice Sachot, Strasbourg; Jacques Tardif, Sherbrooke. 


Animée par Philippe Jonnaert (Université de Sherbrooke), voici une collection en sciences 
de l'éducation créée pour soumettre à la critique des praticiens les réflexions théoriques 
et les résultats de recherches et de travaux actuels et pour offrir aux enseignants et aux professionnels 
de l’éducation des outils pour leur pratique quotidienne et une réflexion sur ces derniers. 


Bonami M. et Garant M. (Éds), Systèmes scolaires et pilotage de ïinnovation. 
Émergences et implantation du changement. 

Bourgeois E. (Ed.), L’adulte en formation : regards pluriels. 

Caillot M. et Raisky C. (Éds), Le didactique au-delà des didactiques. 

Regards croisés sur des concepts fédérateurs. 

Donnay J. et Romainville M. (Éds), Enseigner à l’Université. 

Un métier qui s'apprend? 

FRANCQ B. et MAROY C. (Éds), Formation et socialisation au travail. 

Grégoire J. (Ed.), Évaluer les apprentissages. Les apports de la psychologie cognitive. 
Lepot-Froment C. (Ed.), Éducation spécialisée. Recherches et pistes d’action. 

Mathy C. (Ed.), Enseignement des sciences et valeurs. 

Paquay L., Altet M., Charlier E. et Perrenoud P. (Éds), Former des enseignants 

professionnnels. Quelles stratégies? Quelles compétences? 




s 

Evaluer 

les 

apprentissages 

Les apports de la psychologie cognitive 


Jacques Grégoire (Ed.) 




© De Boeck & Larder S.A. 1996 
Département De Boeck Université 
Paris, Bruxelles 

Toute reproduction d’un extrait quelconque de ce livre, 

par quelque procédé que ce soit, et notamment par photocopie ou microfilm, 

est strictement interdite. 

Printed in Belgium 


D 1996/0074/93 


ISBN 2-8041-2237-9 



Sommaire 


Introduction. 13 

Jacques Grégoire 

1ÈRE PARTIE-LA MATHÉMATIQUE. 17 

Chapitre 1 Quelle démarche d'évaluation diagnostique 

des troubles d'apprentissage en mathématique?. 19 

Jacques Grégoire 

Chapitre 2 Niveaux préalables et apprentissages numériques élémentaires.39 

Jacqueline Bideaud 

Chapitre 3 Apports et limites de la psychologie cognitive 
à l'analyse des procédures de calcul 

et de résolution de problèmes par les élèves .63 

Jean Retschitzki 

Chapitre 4 La mesure des Temps de Réponses aux calculs numériques 

élémentaires en situation scolaire. 81 

Jean-Paul Fischer 

2ème partie - La LECTURE . 99 

Chapitre 5 Évaluer les difficultés de lecture chez l'adulte. 101 

Christine Jourdain, Daniel Zagar et Bernard Lêté 

Chapitre 6 La remédiation des difficultés de lecture 

par la rétroaction verbale sur ordinateur : bilan des recherches . 133 

Bernard LEtê 

3ème partie - La MÉTACOGNITION. 157 

Chapitre 7 Evaluation formative et psychologie cognitive : 

mouvances et tendances . 159 

Gérard Scallon 

Chapitre 8 Analyse des pratiques éducatives visant à faire participer 
l'apprenant à l'évaluation diagnostique, au pilotage 

et à la régulation de ses apprentissages 1. 175 

Josê-Luis Wolfs 

4ème partie - Implications psychométriques. 187 

Chapitre 9 Mesure critériée et théorie de la généralisabilité : 

application aux mesures cognitives. 189 

Dany Laveault 

Conclusion. 213 

Jacques Grégoire 



















Table des matières 


INTRODUCTION. 13 

PREMIÈRE PARTIE 

LA MATHÉMATIQUE 

Chapitre 1 

Quelle démarche d'évaluation diagnostique 

des troubles d'apprentissage en mathématique ?. 19 

Introduction. 20 

1. Qu'EST-CE QUE L'ÉVALUATION DIAGNOSTIQUE DES APPRENTISSAGES ? . 20 

2. Les démarches diagnostiques centrées sur les performances. 22 

3. Les démarches diagnostiques centrées sur les compétences. 24 

3.1 L'approche piagétien ne . 24 

3.1.1 Le modèle piagétien du nombre et son application diagnostique .... 24 

3.1.2 Les limites du modèle piagétien. 27 

3.2 Les approches cognitivistes . 30 

3.2.1 Apports des modèles cognitivistes. 30 

3.2.2 Modèles en composantes et évaluation . 31 

3.2.3 Limites des démarches diagnostiques cognitivistes . 35 

Conclusion . 36 

Chapitre 2 

Niveaux préalables et apprentissages numériques élémentaires . 39 

Introduction. 40 

1. UN REGARD SUR LES THÉORIES. 40 


















Évaluer les apprentissages 


1.1 La théorie piagétienne . 40 

1.2 L'innéisme de Gelman . 42 

1.3 Le constructivisme de Fuson et de Steffe . 44 

1.4 Que nous apportent les théories néo-structuralistes ? . 46 

1.4.1 Pascual-Leone : apprentissages 

et système modulaire de l'attention mentale. 46 

1.4.2 Case et les structures de contrôle . 47 

1.4.3 Kurt Fischer et l'enfant-en-contexte . 48 

2. L'évaluation des capacités «mathématiques» des jeunes enfants : 

LES DONNÉES EMPIRIQUES . 49 

2.1 La recherche de Ginsburg et Russell (1981) . 49 

2.2 La recherche de Grégoire et Van Nieuwenhoven (1993) . 52 

2.3 L'expérience de Cléments (1984) . 55 

3. Contextes d'utilisation, d'évaluation et d'apprentissage. 56 

4. Conclusion . , . . 59 

4. 1 Structures et procédures . 59 

4.2 Contextes et apprentissages mathématiques . 60 

4.3 Les capacités générales de résolution de problème . 60 

4.4 Vers une évaluation diagnostique plus dynamique . 61 


Chapitre 3 

Apport et limites de la psychologie cognitive 
à l'analyse des procédures de calcul 


et de résolution de problème par les élèves . 63 

Introduction . 64 

1. Spécificités et apports de l'approche cognitive . 65 

2. Quelques exemples d'analyse des procédures . 66 

2. 1 Analyse chronométrique des opérations arithmétiques . 67 

2.2 Modèles de diagnostic de Brown et Burton . 68 

2.3 Reconstitution de règles ou stratégies suivies par les sujets . 70 

2.4 Étude des stratégies des joueurs d'awélé . 71 

2.4.1 Présentation du jeu d'awélé. 72 

2.4.2 Méthode. 72 

2.4.3 Modélisation des configurations de réponses . 73 

2.4.4 Principaux résultats. 75 

2.4.5 Discussion. 76 

3. Évaluation de ces travaux 77 

4. Tendances récentes . 79 


































Table des matières 


Chapitre 4 

La mesure des Temps de Réponses aux calculs numériques 
élémentaires en situation scolaire 81 

Introduction. 82 

1. Questions de méthode . 82 

1.1 Tâche de vérification vs tâche de production . 82 

1.1.1 Les contraintes matérielles d'une tâche de production. 82 

1.1.2 Les spécificités d'une tâche de vérification. 83 

1.1.3 La validité de la tâche de vérification . 84 

1.2 La méthode Juste-Faux (Fischer, 1988a) . 85 

1.2.1 Phase de production des données. 85 

1.2.2 Phase de traitement des données . 86 

2. Illustration de la méthode Juste-Faux.... . 86 

2 .1 Conditions de l'observation .. .... 86 

2.2 Résultats . 87 

2.3 Discussion . 87 

2.4 Conclusions ... . ... 89 

3. Applications de la méthode des TR...,. 90 

3.1 A l'élaboration d'un modèle 

du développement numérique 90 

3.2 A l'étude des différences individuelles . 92 

3.3 À l'étude de groupes particuliers d'élèves . 93 

3.3.1 L'étude des sujets MD . 93 

3.3.2 Les sujets HyperActifs . 94 

Conclusion. 95 


DEUXIÈME PARTIE 

LA LECTURE 


Chapitre 5 

Évaluer les difficultés de lecture chez l'adulte . 101 

Introduction. 102 

1. Cadre théorique. 102 

1.1 La reconnaissance des mots . 103 

1.2 L'analyse syntaxique (niveau 3) 104 

1.3 L'analyse sémantique (niveau 4) . 104 

2. Techniques, matériel et étalonnage . 105 

2 .1 Techniques . 106 

2.2 Matériel . 107 

2.2.1 Les épreuves testant l'analyse visuelle. 107 


































Évaluer les apprentissages 


2.2.2 Les épreuves testant l'analyse phonologique. 108 

2.2.3 Les épreuves testant l'étape lexicale. 109 

2.2.4 Les épreuves non linguistiques . 110 

2.2.5 Les épreuves de lecture. 110 

2.3 Etalonnage . 110 

2.3.1 Sujets. 110 

2.3.2 Procédure. 111 

3. Résultats. 111 

3.1 Vitesse de lecture et compréhension . 111 

3.2 Épreuves non-linguistiques . 114 

3.3 Processus impliqués dans la reconnaissance des mots . 115 

3.3.1 Etape visuelle. 115 

3.3.2 Étape phonologique. 117 

3.3.3 Étape lexicale. 118 

3.3.4 Quelles différences peut-on observer 

entre les « mauvais» lecteurs ? Analyse des profils. 120 

Chapitre 6 

La remédiation des difficultés de lecture par la rétroaction 
verbale sur ordinateur : bilan des recherches 133 

Introduction 134 

1. La rétroaction verbale et ses effets 

SUR LES TRAITEMENTS PHONOLOGIQUES . 136 

2. La PRODUCTION DE LA PAROLE SUR ORDINATEUR . 139 

2.1 Données techniques . 139 

2.2 La compréhension de la parole de synthèse . 140 

3. PARADIGMES UTILISÉS DANS LES RECHERCHES SUR LA RÉTROACTION VERBALE . 142 

4. Améliorer le décodage et la reconnaissance des mots . 144 

4.1 Le choix du format de la rétroaction verbale . 144 

4.2 Les effets à long terme de la rétroaction verbale . 148 

4.3 Le comportement de demande d'aide . 151 

5. Améliorer la compréhension . 152 

Conclusion. 154 

TROISIÈME PARTIE 

LA MÉTACOGNITION 

Chapitre 7 

Évaluation formative et psychologie cognitive : 

mouvances et tendances. 159 






























Table des matières 


Introduction. 160 

1. L'héritage des pionniers 160 

2. Lorsque la nécessité est mère de l'invention. 161 

3. Vers UNE LIBÉRATION DE L'ÉVALUATION FORMATIVE. 162 

4. La régulation : pas aussi simple que l'œuf de Colomb !. 165 

5. L'apport des sciences cognitives : 

QUELS MATÉRIAUX NOUVEAUX POUR L'ÉVALUATION FORMATIVE ? 1 68 

6. La lumière au bout du tunnel : la métacognition. 170 

Pour récapituler, en bref 172 


Chapitre 8 

Analyse des pratiques éducatives visant à faire participer 
l'apprenant à l'évaluation diagnostique,au pilotage 


et à la régulation de ses apprentissages 175 

Introduction. 176 

1. La participation de l'élève à l'évaluation diagnostique, 

AU PILOTAGE ET À LA RÉGULATION DE SES APPRENTISSAGES. 176 

2. La métacognition . 177 

2. 7 Origine du concept . 177 

2.2 Modalités de fonctionnement de la métacognition . 177 

2.2.1 Situation 1 : régulation de l'activité cognitive 

sans intervention d'une réflexion métacognitive. 178 

2.2.2 Situation 2 : le sujet développe 

une réflexion métacognitive . 179 

2.2.3 Situation 3 : Réflexion métacognitive et régulation. 181 

3. Analyse des différentes pratiques éducatives 

VISANT À AIDER LES ÉLÈVES À PILOTER, AUTO-ÉVALUER 

ET RÉGULER LEURS PROPRES APPRENTISSAGES 1 82 

4. En GUISE DE CONCLUSION PROVISOIRE. 186 


QUATRIÈME PARTIE 

IMPLICATIONS PSYCHOMÉTRIQUES 


Chapitre 9 

Mesure critériée et théorie de la généralisabilité : 

applications aux mesures cognitives . 189 

1. Le problème de la stabilité en théorie opératoire . 190 

7.7 Le rôle de la fiabilité en développement . 191 

7 .2 Rôle d'une mesure critériée dans l'étude de la stabilité . 193 





















Évaluer les apprentissages 


2. Vers UN MODÈLE HEURISTIQUE DE MESURE DE LA STABILITÉ. 194 

2.7 Difficultés soulevées par la théorie classique . 194 

2.2 La théorie de la généralisabilité . 195 

2.3 Objectifs . 197 

3. Méthodologie. 198 

3.1 Sujets . 198 

3.2 Instrument . 198 

3.3 Procédure . 200 

4. Résultats. 201 

4.1 La théorie de la généralisabilité . 201 

4.2 Plan d'observation et plan d'estimation . 201 

4.3 Composantes de variance et plans de mesure . 201 

4.4 Coefficients de généralisabilité . 203 

5. Discussion . 207 

Conclusion. 210 

CONCLUSION GÉNÉRALE . 213 

BIBLIOGRAPHIE . 219 

INDEX DES TABLEAUX . 237 

INDEX DES FIGURES . 239 

LISTE DES CONTRIBUTEURS . 241 























Introduction 

■ ... ■ ■■ ..::• : ■ :": 

■ . ■ ■■■.-..- : 


Jacques Grégoire 




Évaluer les apprentissages 


L’évaluation des apprentissages scolaires reste fortement influencée 
par un point de vue behavioriste. En effet, l’attention des enseignants et des 
psychologues scolaires se concentre souvent sur une réalité observable de ma¬ 
nière directe et objective : la performance de l’élève. Ce point de vue peut être 
justifié lorsque le but de l’évaluation est de sélectionner, de classer ou de cer¬ 
tifier. Par exemple, lors d’un examen d’admission, la quantification des perfor¬ 
mances et leur comparaison à un seuil minimum procure généralement des 
informations suffisantes pour pouvoir prendre des décisions adéquates. 

La place de plus en plus grande accordée aujourd’hui à l’évaluation for¬ 
mative et à l’évaluation diagnostique modifie en profondeur les besoins des pra¬ 
ticiens. Dans ce cadre, l’important est moins d’enregistrer la réussite ou l’échec 
que de comprendre ce qui est sous-jacent aux performances observées. Quelle 
démarche l’élève a-t-il suivi pour arriver à la réponse qu’il nous propose ? A-t- 
il compris le sens de la procédure utilisée ? Où a-t-il rencontré des difficultés ? 
Comment a-t-il fait face à ces difficultés ? Répondre à ces questions est essen¬ 
tiel pour pouvoir intervenir de manière efficiente. En fait, dans une perspective 
formative ou remédiative, la performance observée doit être prise comme un 
symptôme de l’apprentissage ou de la difficulté d’apprentissage. Le travail de 
l’évaluateur est de décoder ce symptôme, de découvrir sa véritable significa¬ 
tion. Ici, l’erreur n’est plus vue comme une faute mais comme un indicateur du 
dysfonctionnement d’un apprentissage. Son analyse est le point de départ obli¬ 
gé de toute démarche d’aide. 

Comprendre ce qui se passe dans la tête de l’élève implique que le pra¬ 
ticien réalise, sur base de ses observations, des inférences à propos d’une réa¬ 
lité qu’il ne peut directement observer. Pour pouvoir réaliser ces inférences, il 
a besoin d’une théorie du fonctionnement mental et de l’apprentissage. De ce 
point de vue, la théorie piagétienne a constitué, et constitue encore, une réfé¬ 
rence importante pour de nombreux enseignants et psychologues scolaires. 
Elle offre en effet un cadre conceptuel pour comprendre la construction pro¬ 
gressive du raisonnement de l’enfant. Elle permet en particulier d’expliquer 
certaines difficultés d’apprentissage par la non acquisition d’opérations menta¬ 
les relativement générales. Malheureusement, la théorie piagétienne reste sou¬ 
vent insuffisante pour comprendre de manière plus précise les apprentissages 
en situation scolaire. En effet, elle ne prend guère en compte les facteurs con¬ 
textuels et proprement psychologiques qui, inévitablement, interviennent dans 
tout apprentissage. 

La psychologie cognitive apparaît aujourd’hui comme une référence 
théorique importante pour le praticien soucieux de comprendre le sujet appre¬ 
nant. Elle lui procure de nouveaux concepts qui viennent combler les lacunes 
de la théorie piagétienne. Toutefois, à l’inverse de la théorie piagétienne, la psy¬ 
chologie cognitive ne constitue pas une théorie unifiée. Il serait donc plus cor¬ 
rect de parler des théories cognitives, au pluriel. 

Bien que la transition entre le behaviorisme et le cognitivisme se soit 
faite progressivement, on peut situer le démarrage du courant cognitiviste 
autour de 1960. Avec le recul, la conférence donnée par Allen Newell et Her- 
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bert Simon en 1958 (Lachman et al., 1979) semble avoir joué le rôle d’un dé¬ 
clencheur. Newell et Simon proposèrent alors une analogie entre le traitement 
de l’information par l’ordinateur et par l’être humain. La nouveauté ne prove¬ 
nait pas seulement du rapprochement entre la pensée humaine et le fonction¬ 
nement de l’ordinateur. Elle venait surtout de l’affirmation d’un point de vue 
radicalement différent de celui du behaviorisme. En effet, les chercheurs por¬ 
taient leur attention sur ce qui se passait entre le stimulus et la réponse et pré¬ 
tendaient étudier les processus internes de manière scientifique. 

L’affirmation que les processus mentaux existent et peuvent être étu¬ 
diés rigoureusement constitue le premier postulat sur lequel s’accordent les 
chercheurs qui s’inscrivent dans le courant cognitiviste. Un second postulat est 
que l’être humain traite de manière active l’information reçue : il sélectionne, 
met en relation, calcule... Enfin un troisième postulat sur lequel se rejoignent 
les cognitivistes est qu’il est possible d’évaluer ce traitement sur la base du 
temps de réponse et de la précision de la réponse. En effet, les traitements 
mentaux prennent du temps. Par conséquent, il est possible d’estimer quels 
processus mentaux sont mis en oeuvre, en comparant le temps mis pour répon¬ 
dre à différents stimuli. Dans le présent ouvrage, le chapitre de Fischer propo¬ 
se une intéressante illustration de l’usage du temps de réponse pour l’étude des 
processus mentaux. La précision de la réponse est également un bon indica¬ 
teur des traitements mentaux réalisés par un sujet. Pour pouvoir répondre cor¬ 
rectement à certains stimuli, le sujet peut en effet être contraint d’utiliser une 
procédure déterminée. Les erreurs qu’il va éventuellement commettre seront 
alors la manifestation de l’usage de procédures alternatives, moins adéquates. 

Il est évident que les théories cognitives offrent un cadre conceptuel 
nous permettant de mieux comprendre les apprentissages des élèves. Mais le 
passage de la théorie à la pratique ne va malheureusement pas de soi. La majo¬ 
rité des chercheurs en psychologie cognitive ne se sont pas intéressés aux ap¬ 
plications de leurs découvertes. Il existe donc un important décalage temporel 
entre le développement des modèles théoriques et leur traduction dans les pra¬ 
tiques d’évaluation. Les colloques et les publications sur cette question com¬ 
mencent seulement à apparaître. Et de nombreuses questions théoriques et 
méthodologiques restent posées. 

C’est dans ce contexte que, dans le cadre des rencontres du Réseau 
Education et Formation (REF) de Louvain-la-Neuve (septembre 1994), nous 
avons choisi de consacrer un symposium à la question des apports de la psy¬ 
chologie cognitive à l’évaluation des apprentissages scolaires. Durant deux 
jours, des spécialistes de la psychologie cognitive et de l’évaluation des appren¬ 
tissages se sont rencontrés pour échanger sur cette question. Le présent 
ouvrage est le fruit de ces rencontres particulièrement stimulantes pour la ré¬ 
flexion. Nous espérons que le lecteur y trouvera une source d’inspiration et un 
ferment pour le développement de ses propres pratiques. 

Pour faciliter la consultation de cet ouvrage, nous avons regroupé les 
communications selon quatre grands thèmes : (1) l’évaluation des apprentis¬ 
sages mathématiques; (2) l’évaluation de la lecture; (3) la place de la métaco- 



Évaluer les apprentissages 


gnition dans l’évaluation et (4) les implications psychométriques des nouveaux 
modèles d’évaluation. 

La première partie, consacrée à la mathématique, comprend quatre ar¬ 
ticles. Dans le premier de ceux-ci, Jacques Grégoire réfléchit sur les modèles 
utilisés pour l’évaluation diagnostique des troubles des apprentissages mathé¬ 
matiques. Il confronte en particulier le modèle piagétien et différents modèles 
cognitivistes. Jacqueline Bideaud aborde ensuite la question de l’évaluation 
des capacités “mathématiques” que possèdent déjà les jeunes enfants avant 
d’aborder l’apprentissage de la mathématique élémentaire. Elle brosse par la 
même occasion un tableau des théories piagétiennes et néopiagétiennes de 
l’acquisition de la notion de nombre. Jean Retschitzki présente, dans une per- 
pective historique, les apports de la psychologie cognitive pour la compréhen¬ 
sion de la résolution de problèmes. Il en souligne certaines limites et note 
l’émergence de modèles explicatifs concurrents. Enfin, Jean-Paul Fischer dé¬ 
crit la mise en place en situation scolaire d’une évaluation du temps de réponse 
à des calculs élémentaires. Les possibilités diagnostiques de cette méthode 
d’évaluation sont illustrées et discutées. 

La seconde partie de l’ouvrage est centrée sur le thème de la lecture. 
Le texte de Christine Jourdain, Daniel Zagar et Bernard Lété est consacré 
à l’évaluation diagnostique des difficultés de lecture chez les adultes. Un cadre 
théorique est proposé et un ensemble d’épreuves est présenté, permettant une 
évaluation pas à pas des processus enjeu dans l’acte de lecture. Bernard Lété 
présente l’usage que l’on peut faire de l’ordinateur pour améliorer les capacités 
en lecture. Au travers d’une analyse minutieuse de la littérature sur cette ques¬ 
tion, il nous montre comment, en s’appuyant sur un modèle de la lecture, l’or¬ 
dinateur peut devenir un outil d’évaluation formative particulièrement 
efficace. 

La troisième partie de l’ouvrage concerne l’utilisation du concept de 
métacognition dans le cadre de l’évaluation formative. Gérard Scallon nous re¬ 
trace l’évolution des pratiques d’évaluation formative et analyse les difficultés 
rencontrées. II nous montre comment la psychologie cognitive, particulière¬ 
ment grâce au concept de métacognition, a permis à l’évaluation formative de 
sortir des ornières dans lesquelles elle risquait de s’enliser. José-Luis Wolf s dé¬ 
veloppe plus spécifiquement l’usage de la métacognition comme moyen de fai¬ 
re participer l’apprenant à l’évaluation diagnostique de ses apprentissages. Il 
présente une grille permettant d’analyser les pratiques pédagogiques qui vont 
dans ce sens. 

Enfin, l’ouvrage se clôture par le texte de Dany Laveault qui est con¬ 
sacré à la question des relations entre les modèles cognitifs et les méthodes 
psychométriques. Il nous montre que la théorie de la généralisabilité peut être 
un outil puissant pour nous aider à mesurer de manière valide et fiable les dif¬ 
férentes facettes du traitement d’un problème par un sujet. 
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Quelle démarche d'évaluation 
diagnostique des troubles 

d'apprentissage 
en mathématique ? 


Jacques Grégoire 


La mathématique 


Introduction 

Lorsque l’on compare l’évaluation de la lecture et celle des apprentis¬ 
sages mathématiques, on constate un écart considérable quant au nombre de 
travaux et de recherches qui y sont consacrés. L’impact des travaux piagé- 
tiens sur le nombre ont quelque peu masqué le manque d’investissement du 
champ des mathématiques par les spécialistes de l’évaluation. Il a fallu atten¬ 
dre le début des années 80 et les recherches cognitivistes sur les mathémati¬ 
ques pour voir cet investissement quelque peu grandir. Mais, comme nous le 
verrons, les carences restent énormes et les praticiens désireux de réaliser 
une évaluation diagnostique des apprentissages mathématiques souffrent du 
manque d’outils et de référentiels théoriques suffisamment larges et solides. 

Le présent texte est consacré à une analyse critique des modèles 
théoriques qui peuvent guider l’évaluation diagnostique des apprentissages 
mathématiques. Nous discutons de leurs postulats de base ainsi que de leurs 
avantages et limites. Nous terminons en proposant une intégration des diffé¬ 
rents points de vue au sein de la démarche diagnostique. 

1. QU'EST-CE QUE L'ÉVALUATION DIAGNOS¬ 
TIQUE DES APPRENTISSAGES ? 


Le concept d’évaluation diagnostique n’est pas défini de manière uni¬ 
forme par tous les spécialistes. Il soulève par ailleurs des questions de fond 
qui, étonnamment, sont rarement abordées et discutées. Dans cette section, 
nous commencerons par préciser ce que nous entendons par évaluation dia¬ 
gnostique. Nous expliciterons et discuterons ensuite plusieurs postulats sur 
lesquels s’appuie la démarche d’évaluation diagnostique. 

Se référant à la typologie des formes d’évaluation proposées par 
Bloom et ses collaborateurs, Scallon (1988a) souligne que, pour ces auteurs, 
l’évaluation diagnostique remplit deux fonctions. La première est de nature 
préventive et concerne l’intégration des élèves dans une nouvelle séquence 
d’apprentissage. Dans ce cas, l’évaluation diagnostique vise à mettre en'évi¬ 
dence les forces et les faiblesses de chaque élève afin de préciser le point d’en¬ 
trée adéquat dans la séquence d’apprentissage et de déterminer le mode 
d’enseignement le plus adapté. 

Une seconde fonction de l’évaluation diagnostique est de 
«déterminer la cause de difficultés persistantes chez certains élèves» 
(Scallon, 1988a, p.69). Sous certains aspects, cette fonction rejoint celle de 
l’évaluation formative qui a également pour but de déceler les difficultés pou¬ 
vant se présenter en cours d’apprentissage afin d’y remédier rapidement. Par 
rapport à l’évaluation formative, la spécificité de l’évaluation diagnostique est 
d’être à la fois plus approfondie et plus globale (prise en compte des facteurs 
motivationnels, environnementaux...). Mais les limites restent floues. Scallon 
propose une distinction plus nette en se référant aux types de cause des dif- 
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Acuités d’apprentissage. L’évaluation diagnostique s’intéresserait aux causes 
exogènes à la situation d’apprentissage alors que l’évaluation formative pren¬ 
drait uniquement en compte les causes endogènes à cette même situation. En 
ce sens, le caractère diagnostique de l’évaluation formative resterait spécifi¬ 
quement pédagogique. 

De son côté, Cardinet (1988) ne retient pas cette distinction et parle 
d 'évaluation formative diagnostique pour désigner tout examen approfondi 
des difficultés des élèves quelles qu’en soient les causes. Par ailleurs, il évite 
d’utiliser le terme de diagnostique à propos de ce qu’il appelle l 'évaluation 
formative de départ, qui désigne l’appréciation des pré-acquis des élèves 
dans le domaine à étudier. Pour notre part, nous adoptons cette distinction 
qui permet d’éviter les confusions et nous réservons le terme d’évaluation dia¬ 
gnostique pour désigner l’examen approfondi des troubles d’apprentissages 
en vue d’entreprendre une action de remédiation. Cette évaluation peut se fai¬ 
re au sein de la classe ou en dehors de celle-ci. Dans ce dernier cas, elle peut 
être menée par des psychologues scolaires, des logopèdes... 

Mais qu’est-ce qu’une évaluation approfondie des troubles 
d’apprentissage ? Cette démarche ne va pas de soi et plusieurs de ses postu¬ 
lats, souvent implicites, demandent à être discutés. Le premier concerne le ni¬ 
veau de la réalité à évaluer. Depuis les travaux de Chomsky 1 , la distinction 
entre compétence et performance a été largement adoptée. La performance 
fait référence aux comportements observables produits par le sujet. Quant à 
la compétence, elle est constituée d’un ensemble de capacités organisées qui 
sous-tendent les performances. Les compétences ne sont pas directement ob¬ 
servables mais peuvent seulement être inférées à partir des performances. 

Au niveau de la démarche diagnostique, nous retrouvons cette dis¬ 
tinction. Certaines démarches sont en effet centrées sur la tâche et la perfor¬ 
mance; elles sont fondamentalement a-théoriques. D’autres, par contre, 
s’appuient sur un modèle théorique de la réalité sous-jacente aux performan¬ 
ces. De ce choix initial découle un certain nombre de contraintes concernant 
les outils d’évaluation. Dans le cas d’une approche centrée sur les compéten¬ 
ces, il est nécessaire de valider la liaison entre la compétence et la tâche prise 
comme son révélateur. En particulier, il faut éviter que les tâches sélection¬ 
nées ne mesurent des capacités étrangères aux compétences visées. Dans le 
cas d’une approche centrée sur les performances, ce dernier problème ne se 
pose guère. En effet, dans la mesure où l’on ne s’intéresse qu’aux comporte¬ 
ments observables, la nature exacte des capacités sous-jacentes n’est pas pri¬ 
se en compte. Par contre, on est en droit de s’interroger sur la possibilité de 


1 «Nous faisons une distinction fondamentale entre la compétence (la connaissance 
qu’a le locuteur-auditeur de sa propre langue) et la performance (l’usage effectif du lan¬ 
gage dans des situations concrètes). [...] Le problème pour le linguiste, comme pour 
l’enfant qui apprend un langage, est de déterminer à partir de données de performance le 
système de règles sous-jacent qui a été maîtrisé par le locuteur-auditeur et que celui-ci uti¬ 
lise dans sa performance effective» (Chomsky, p.4, 1965). 
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généraliser le comportement observé. Ici, le résultat risque en effet d’être très 
dépendant de la tâche proposée. 

Un second postulat qui sous-tend l’évaluation diagnostique des ap¬ 
prentissages concerne la place que l’on attribue au contexte. Certains auteurs 
(Resnick & Resnick, 1991) soulignent que les capacités des sujets prennent 
une forme différente selon les contextes où elles se révèlent. Pour ceux-ci, 
une évaluation valide ne peut se concevoir que contextualisée. Pour être cor¬ 
rectement évalué, le sujet doit en effet être confronté à une tâche signifiante 
et motivante. Cet accent mis sur l’importance du contexte est certes pertinent 
mais il est aussi simplificateur. Un même contexte n’est en effet pas également 
stimulant et facilitant pour tous les sujets, ce qui pose des problèmes d’équité 
et de généralisation des résultats. Par ailleurs, il est incorrect d’affirmer qu’il 
y aurait des tests contextualisés et d’autres pas. Comme le fait remarquer 
Sternberg (1990, p.221), même dans les tests standardisés «les items sont 
contextualisés en relation avec l’environnement dans lequel ils sont sup¬ 
posés mesurer les performances, c’est-à-dire l’environnement scolaire». 
Par conséquent, l’opposition n’est pas entre les mesures contextualisées et les 
mesures décontextualisées mais entre les premières et les mesures 
«transcontextualisées» (Messick, 1994). Messick souligne en effet que, si 
l’on veut éviter d’être confronté à une prolifération de capacités qualitative¬ 
ment différentes selon le contexte d’usage, nous devons tirer des inférences 
en prenant en compte la consistance des performances au travers des contex¬ 
tes. Cette consistance est alors prise comme un indicateur fiable des compé¬ 
tences visées. 

Enfin, un troisième postulat de l’évaluation diagnostique est lié à la lé¬ 
gitimité que l’on reconnaît ou non à la décomposition des compétences com¬ 
plexes en aptitudes élémentaires. Resnick et Resnick (1990) plaident pour 
une évaluation qui respecte la complexité des capacités car une évaluation qui 
se centre sur les aptitudes élémentaires ne prend pas en compte les interac¬ 
tions entre celles-ci. Et il est vrai que les compétences ne sont pas égales à la 
somme des aptitudes qui les composent. Toutefois, on imagine mal comment 
un outil diagnostique pourrait faire l’économie d’une analyse des compétences 
complexes. De plus, on peut douter de la possibilité d’apprécier véritablement 
la complexité d’une compétence. En effet, le système de cotation des perfor¬ 
mances est, le plus souvent, analytique : le score à une tâche complexe n’est 
alors que la somme des scores attribués aux performances élémentaires. 

2. LES DÉMARCHES DIAGNOSTIQUES 
CENTRÉES SUR LES PERFORMANCES 

La majorité des tests d’évaluation diagnostique des apprentissages 
mathématiques se concentre sur les performances et souffre d’un manque 
cruel de modèle théorique permettant de comprendre les causes profondes 
des phénomènes observés. Comme le font justement remarquer Snow et Loh- 
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man (1989, p.268), «les créateurs d’items sont le plus souvent des spécia¬ 
listes du contenu qui travaillent sur base de spécifications de test sans 
aucune relation avec une théorie psychologique pertinente». Dans cette 
perspective, les items et les scores sont des boîtes noires qui n’offrent aucune 
explication des performances. 

A titre d’illustration, nous pouvons prendre deux exemples de ce gen¬ 
re de test. Le premier est le Wide Range Achievement Test -WRAT- (Jastak 
& Wilkinson, 1984) qui est un test d’évaluation des apprentissages largement 
utilisé aux USA. Le manuel présente l’évaluation des troubles d’apprentissage 
comme une des fonctions de ce test. Selon l’auteur, «il permet de détermi¬ 
ner précisément où un sujet a des difficultés et permet dès lors de pres¬ 
crire des programmes de remédiation pour le traitement de ces faiblesses 
spécifiques» (Jastak & Wilkinson, 1984, p.l). 

Concrètement, pour les enfants de 5 ans à 11 ans 11 mois, la partie 
arithmétique du WRAT comprend 7 questions orales (essentiellement en rap¬ 
port avec la numération) et 44 calculs écrits. Les scores à ces items permet¬ 
tent de calculer une note brute en arithmétique, qui peut ensuite être traduite 
sous forme de note standardisée, de percentile ou de niveau scolaire en réfé¬ 
rence aux résultats d’un échantillon représentatif de la population des élèves 
américains. Les différents items ont été sélectionnés sur base du modèle de 
Rasch. L’auteur postule donc un continuum latent unidimentionnel sur lequel 
les items peuvent être ordonnés et mis en correspondance avec un niveau 
d’habileté 0 (thêta). Mais est-il défendable de considérer la compétence en 
arithmétique comme une réalité unidimentionnelle ? Par ailleurs, le caractère 
diagnostique de l’outil provient uniquement de la comparaison du score glo¬ 
bale du sujet avec celui d’un groupe de référence. L’élève dont les résultats 
sont par trop inférieurs à ceux de ce groupe est considéré comme en difficulté, 
sans qu’aucune explication de cette situation ne puisse être avancée. 

Le deuxième exemple est celui du Key Math Revised (Connolly, 
1988). Cet instrument est explicitement présenté comme «un inventaire 
diagnostique des bases en mathématiques». Par rapport au WRAT, le Key 
Math est beaucoup plus analytique. Trois grandes catégories de capacités 
sont évaluées : les concepts de base, les opérations et les applications. Chaque 
catégorie est elle même divisée en sous-catégories (par exemple, «addition», 
«soustraction»...) et en domaines (par exemple, «les faits arithmétiques», 
«les algorithmes pour additionner les nombres entiers», «l’addition des nom¬ 
bres rationnels»...). Ici aussi, le modèle de Rasch a été utilisé pour ordonner 
les items de chaque catégorie. Les résultats bruts sont transformés et compa¬ 
rés à ceux d’un échantillon représentatif de la population. 

Bien que construit avec grand soin, le Key Math soulève des questions 
fondamentales. Le découpage en catégories et en sous-catégories n’est ap¬ 
puyé sur aucun modèle théorique. En fait, nous retrouvons les subdivisions 
traditionnelles présentées dans les programmes de mathématique de l’école 
primaire. Il s’agit d’un découpage de matière et non d’une analyse appuyée sur 
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un modèle cohérent de l’apprentissage de la mathématique. L’interprétation 
des résultats se fait non seulement au niveau des profils mais aussi au niveau 
des items dont l’auteur offre une description en terme d’objectifs comporte¬ 
mentaux (par exemple, «le sujet peut additionner des fractions de même 
dénominateur »). Le point de vue reste ici très behavioriste. Aucune hypo¬ 
thèse n’est avancée à propos des processus utilisés par l’élève pour résoudre 
une problème. De même, aucune explication n’est proposée pour comprendre 
un échec. Ainsi, lorsque le sujet ne peut répondre correctement à la question 
«2/5 + 1/5 », nous pourrons simplement dire qu’il ne peut additionner les frac¬ 
tions de même dénominateur. Pourquoi ne peut-il y arriver ? Quelle relation 
peut-on faire entre cet échec et les autres performances du même élève ? 
Quels sont les pistes pour une éventuelle prise en charge remédiative ?... Nous 
n’en savons rien! 

Comme nous pouvons nous en rendre compte au travers des deux 
exemples que nous venons brièvement de présenter, une approche en terme 
de performance se révèle rapidement insuffisante pour le diagnostic. Tout au 
plus permet-elle de réaliser une première appréciation de la situation. Mais 
elle n’offre pas de véritable compréhension des difficultés rencontrées par les 
sujets et, partant, n’offre guère d’assise solide à une prise en charge remédia¬ 
tive efficace. Celle-ci risque de n’être qu’une répétition des explications qui 
ont précédemment échoué. 

3. LES DÉMARCHES DIAGNOSTIQUES 
CENTRÉES SUR LES COMPÉTENCES 

3.1 L'approche piagétienne 

3 . 1.1 Le modèle piagétien du nombre 
et son application diagnostique 

Le modèle piagétien a occupé, et occupe encore, une place importan¬ 
te dans le diagnostic des troubles d’apprentissage en mathématique. Il permet 
en effet de dépasser le simple constat de réussite ou d’échec et de saisir le 
mode de raisonnement utilisé par le sujet. En ce sens, il offre une compréhen¬ 
sion des phénomènes observés et un certain nombre de pistes pour les actions 
remédiatives. Malheureusement, nous allons voir que ce modèle séduisant 
n’est pas sans limite et qu’aujourd’hui, il ne peut te,uir lieu d’unique référence 
pour le diagnostic. 

Rappelons brièvement le point de vue piagétien sur le nombre. Com¬ 
me le souligne Bideaud (1991, p. 19), dans l’épistémologie piagétienne, «le su¬ 
jet est acteur, auteur même et constructeur de l’objet». Ce postulat de base 
détermine profondément le concept de nombre défendu par Piaget. Selon Pia- 
get, le nombre n’est pas une réalité externe que l’enfant absorberait passive¬ 
ment. Au contraire, le nombre est construit par l’enfant grâce à ses capacités 
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logiques. Il est en effet évident que le nombre n’est pas une propriété des ob¬ 
jets au même titre que la couleur ou la dureté. Le nombre est une relation en¬ 
tre les objets que crée le sujet par abstraction réfléchissante. Sa véritable 
source est interne au sujet. 

Piaget propose ainsi une explication psychogénétique des opérations 
mathématiques où la logique joue le rôle d’un système normatif que construit 
progressivement l’enfant. Dans cette perspective, «l’étude du développe¬ 
ment du nombre sera celle des opérations «sur le nombre» et celle des 
sous-systèmes de sériation et de classification gui les fondent» (Bideaud, 
1991, p.20). Dans son ouvrage écrit en collaboration avec Szeminska, «La ge¬ 
nèse du nombre chez l’enfant» (1941), Piaget s’attache à décrire ces capa¬ 
cités logiques que, progressivement, l’enfant acquiert et coordonne pour 
arriver à maîtriser le concept de nombre. Ces capacités se développent plus 
au moins parallèlement et leur intégration débute avant leur maîtrise complè¬ 
te. Décrivons-les brièvement. 

L’opération de sériation consiste à ordonner les objets à partir de 
leurs différences. Il s’agit de distinguer les objets en ne tenant compte que 
d’une ou de plusieurs variables (la taille, le poids...). Le sujet crée donc une 
relation asymétrique entre les objets et fait abstraction de leurs équivalences. 
Au niveau numérique, la sériation est illustrée par l’acquisition de la suite or¬ 
donnée des nombres entiers naturels : 5 est plus grand que 4 qui lui-même est 
plus grand que 3. Lorsque l’enfant atteint le niveau opératoire de la sériation, 
il peut coordonner les relations inverse n+1 >n et n< n+1. Il peut donc dérouler 
la série dans les deux sens. 

L’opération de classification consiste, elle, à ranger les objets en un 
ensemble commun en faisant abstraction de leurs différences et en ne prêtant 
attention qu’à leurs qualités communes. La relation créée est ici l’équivalence. 
Elle permet la construction de classes logiques. Au niveau numérique, la clas¬ 
sification est à la base de l’aspect cardinal du nombre. Le nombre cardinal re¬ 
présente en effet un ensemble d’éléments considérés comme équivalents, en 
l’occurrence comme des unités. La maîtrise des opérations de classification 
évolue vers la capacité de réaliser des classifications hiérarchiques. Les clas¬ 
ses peuvent en effet être emboîtées les unes dans les autres. L’enfant apprend 
dès lors à raisonner sur les relations entre les parties et le tout. Au niveau du 
nombre, cela se marque par la compréhension de l’inclusion des classes 
numériques : la classe «3» est incluse dans la classe «4» qui, elle-même, est 
incluse dans la classe «5». 

Les différentes capacités logiques que nous venons de détailler vont 
progressivement se coordonner jusqu’à la maîtrise des nombres comme clas-. 
ses sériées. Car «les nombre finis sont [...] nécessairement à la fois cardi¬ 
naux et ordinaux et cela résulte de la nature même du nombre qui est 
d’être un système de classes et de relations asymétriques fusionnées en 
un même tout opératoire» (Piaget et Szeminska, 1941, p.204). A ce stade, 
l’enfant comprend que les nombres sont des classes emboîtées mais égale- 
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ment ordonnées, qu’ils sont à la fois ressemblance (classe) et différence (or¬ 
dre). Par exemple, les éléments qui composent le nombre 5 sont équivalents 
en tant qu’unités mais ils sont, en même temps, non équivalents car ils peu¬ 
vent être ordonnés. 

Et la conservation ? Jusqu’à présent, nous n’avons pas parlé de la 
conservation du nombre qui apparaît souvent comme un aspect essentiel à 
évaluer. En réalité, la conservation n’est pas une propriété du nombre qui 
viendrait s’ajouter aux propriétés cardinales et ordinales. La conservation doit 
plutôt être vue comme constitutive des caractéristiques cardinales et ordina¬ 
les du nombre. Rappelons que pour qu’un enfant soit conservant, «la con¬ 
naissance empirique doit être interprétée et corrigée par la raison» 
(Kamii, 1990, p.38). Pour pouvoir se dégager des apparences sensibles, la 
pensée doit être réversible : elle doit être capable d’exécuter la même opéra¬ 
tion dans les deux sens de parcours, en ayant conscience qu’il s’agit de la 
même action. Ainsi, l’enfant comprend que la modification de la disposition 
spatiale des éléments ne modifie nullement le cardinal d’un ensemble dénom¬ 
bré. Il peut en effet revenir mentalement à la situation initiale et se dégager 
ainsi des changements de surface. Si nous ne retirons ni n’ajoutons rien à un 
ensemble, celui-ci conserve le même cardinal malgré les apparences. 

Bien que créé voici 50 ans, le modèle piagétien du nombre reste tou¬ 
jours une référence pour l’évaluation diagnostique. Certaines erreurs des élè¬ 
ves ne peuvent être réellement comprises qu’en lien avec la maîtrise du 
concept de nombre. Trop souvent, l’attention des enseignants se focalise sur 
les procédures au détriment de la notion du nombre que possèdent les en¬ 
fants. Or des erreurs fréquentes découlent avant tout d’une mauvaise compré¬ 
hension du nombre sur lequel sont effectuées les opérations arithmétiques 
(Jonnaert, 1994, pp. 225-233). 

Prenons l’exemple d’une soustraction écrite dont le résultat est 

erroné : 

506 

-42 

544 

Si nous analysons l’erreur en terme de procédure, nous pouvons avan¬ 
cer l’hypothèse qu’estimant ne pas pouvoir effectuer «0 - 4 », le sujet a inversé 
les termes et effectué «4-0». Le sujet n’aurait donc pas appliqué la procédure 
correcte qui consiste à réaliser un emprunt dans le rang des centaines pour le 
rang des dizaines. Or, l’élève qui effectue une différence entre deux entiers 
positifs doit se rendre compte que le résultat recherché doit nécessairement 
être inclus dans le premier terme de l’opération. Dans l’exemple ci-dessus, le 
résultat doit logiquement être inclus dans «506». Par conséquent, lorsque 
l’élève propose «544» comme réponse, il ne commet pas seulement une er¬ 
reur de procédure mais aussi une faute de logique. Sans effectuer l’opération, 
il devrait reconnaître que cette réponse ne peut pas être correcte. 
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Ce bref exemple, nous démontre l’intérêt de la référence au modèle 
piagétien dans le cadre du diagnostic des difficultés en mathématique. Mais, 
pratiquement, comment conduire une évaluation diagnostique fondée sur le 
modèle piagétien ? Une première possibilité est de se référer aux ouvrages de 
Piaget et d’en extraire les épreuves qui apparaissent les plus adéquates. Une 
autre possibilité est d’utiliser une batterie d’épreuves construites sur base du 
modèle piagétien, comme l’UDN 80 (Meljac, 1980). Cette batterie est présen¬ 
tée comme «un échantillonnage [...] d’occasions au cours desquelles l’en¬ 
fant examiné fait preuve de ses possibilités de maniement du nombre et 
des opérations mentales qui y sont associées» (Meljac, 1980, p. 9). Son ob¬ 
jectif est explicitement d’aider à comprendre les difficultés d’apprentissage en 
mathématique et de servir de guide lors des prises en charge rééducatives. 
L’UND 80 est composée de 13 épreuves regroupées en quatre catégories : (1) 
des épreuves concernant les structures logiques élémentaires (classification 
et sériation); (2) des épreuves de conservation; (3) des épreuves portant sur 
l’utilisation des nombres dans des situations variées et (4) des épreuves met¬ 
tant en cause la notion «d’origine», de point de départ d’une action. Dans la 
démarche diagnostique, la mise en relation des résultats aux différentes 
épreuves joue un rôle essentiel. Les rapports existant entre les performances 
aux épreuves de type logique et l’utilisation des premières notions mathéma¬ 
tiques doit faire l’objet d’une attention particulière. 

3 . 1.2 Les limites du modèle piagétien 

• Importer la théorie opératoire dans le domaine de l’évaluation est mal¬ 
heureusement moins simple qu’il n’y paraît au premier abord. Comme le rap¬ 
pelle, de façon quelque peu provoquante, Claire Meljac (1988, p.200) : 
«Contrairement aux idées reçues, Piaget n’a jamais été un psychologue- 
encore moins un psychologue de l’enfance- moins encore un psychologue 
de l’enfant». Et il est vrai que, dès l’origine et tout au long de sa vie de cher¬ 
cheur, le point de vue de Piaget n’a pas cessé d’être, avant tout, celui d’un phi¬ 
losophe. Plus précisément, celui d’un philosophe de la connaissance. Son but 
est en effet «de reconstituer la genèse ou les phases de formation de l’in¬ 
telligence, jusqu’à pouvoir rendre compte du niveau opératoire final» 
(Piaget, 1947, p.55). Ses recherches sur les enfants n’ont été qu’un moyen 
pour atteindre cet objectif. Les épreuves qu’il a imaginées avec ses collabora¬ 
teurs n’ont donc jamais eu pour but le diagnostic des troubles d’apprentissage. 
L’application de ses épreuves en psychologie différentielle et en éducation ne 
faisait pas partie de ses intérêts, bien qu’il ait généralement regardé avec bien¬ 
veillance les tentatives en ce sens réalisées par d’autres 2 . Extraire des épreu- 


2 «L’idée d’appliquer au diagnostic et au pronostic des arriérations, de la débilité men¬ 
tale et des troubles psychopathologiques infantiles en général, les résultats des études sur 
le développement des structures opératoires chez l’enfant normal s’est révélée féconde et 
même indispensable dans la mesure où ces études atteignent le dynamisme formateur de 
l’intelligence au sens le plus large» (Piaget, préface à la seconde édition de l’ouvrage d’Inhel- 
der, «Le diagnostic du raisonnement chez les débiles mentaux», 1943, p.2). 
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ves d’un de ses ouvrages et les appliquer sans autre forme de procès, est donc 
un peu rapide. Ces épreuves n’ont pas été créées dans une optique différen¬ 
tielle et ne possèdent pas, dans l’état où nous les lègue Piaget, toutes les qua¬ 
lités nécessaires pour occuper la fonction d’instrument d’évaluation. Diverses 
précautions méthodologiques s’imposent (cfr Grégoire, 1992, pour une analy¬ 
se détaillée de cette question). 

Certaines concernent la standardisation des procédures. Evaluer est 
toujours comparer, que ce soit à un objectif d’apprentissage ou aux perfor¬ 
mances d’autres élèves. Si les conditions dans lesquelles les sujets passent les 
épreuves ne sont pas identiques, des comparaisons valides ne sont plus possi¬ 
bles. 


Un autre problème méthodologique concerne la définition des condui¬ 
tes intermédiaires. Dans une perspective diagnostique, il ne suffit souvent pas 
de classer les conduites selon qu’elles sont de niveau opératoire au non. Une 
appréhension plus fine du niveau de développement cognitif est souvent utile. 
Les étapes intermédiaires décrites par Piaget peuvent être des points de re¬ 
père intéressants. Mais ils ne sont pas toujours suffisants ni même pertinents. 
Par exemple, les travaux de Tollefsrud-Anderson et al. (1991) sur la conser¬ 
vation du nombre mettent clairement en évidence une étape du développe¬ 
ment où la réussite de l’épreuve de conservation est acquise grâce au 
comptage (et non grâce au seul raisonnement logique). Lors de cette étape, le 
comptage est utilisé comme une technique de preuve qui permet à l’enfant de 
conforter la validité de son raisonnement. Lorsque la solidité de ce raisonne¬ 
ment est suffisamment assurée, l’enfant peut alors abandonner la vérification 
par le comptage. 

Cet exemple renvoie à la question la plus épineuse posée par l’évalua¬ 
tion diagnostique basée sur le modèle piagétien : celui de la validité. Les 
épreuves piagétienne mesurent-elles bien ce qu’elles prétendent mesurer, et 
rien que cela ? Cette question rejoint celle que nous avons déjà discutée dans 
le § 1. Dès le moment où notre évaluation se concentre sur les compétences, 
et non sur les performances, nous devons être certains que les tâches choisies 
sont de bons révélateurs de ces compétences. Or, de nombreux travaux sur 
les épreuves piagétiennes indiquent que cette exigence est difficile à rencon¬ 
trer. Ainsi, Fayol (1990), dans une importante recension des recherches sur 
l’évaluation de la conservation du nombre, remarque que les résultats mettent 
en évidence l’impact, parfois dominant, de variables considérées par Piaget 
comme secondaires. C’est par exemple le cas de la formulation verbale des 
questions et de la disposition visuo-spatiale des ensembles présentés. 

Un constat similaire est fait par Bideaud (1988) à propos de l’opéra¬ 
tion de classification. Classiquement, la maîtrise opératoire de la classification 
est évaluée au travers de la quantification de la relation d’inclusion par la 
question : «Y a-t-il plus de A que de B ?», B étant un sous-ensemble inclus 
dans l’ensemble A. L’enfant de niveau opératoire arrive à la solution correcte 
grâce à un raisonnement du type : A = B + B’ et B = A - B’, donc A > B. A priori, 
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nous devrions obtenir des résultats similaires à toutes les épreuves faisant ap¬ 
pel au même raisonnement. Or, ce n’est pas ce qui est observé. Les pourcen¬ 
tages de réussite rapportés par Piaget lui-même varient sensiblement selon les 
épreuves. Par la suite, de nombreux chercheurs ont repris les épreuves d’in¬ 
clusion soit dans leur forme originale soit légèrement modifiées. Leurs résul¬ 
tats confirment que des facteurs parfois minimes peuvent rendre la tâche plus 
ou moins difficile et affecter notablement les réponses des enfants (la nature 
perceptive ou verbale du matériel utilisé, l’extension des sous-classes, la pré¬ 
gnance perceptive de la classe emboîtante,...). Partant de ce constat, Bideaud 
(1988, pp.97-98) conclut qu’ «il est difficile de considérer la réponse cor¬ 
recte et justifiée d’inclusion comme le critère de la classification opéra¬ 
toire, dans sa relation avec la sériation et le nombre». Et elle ajoute «[le] 
concept même de «décalage horizontal» qui est invoqué implicitement à 
partir du moment où une bonne réponse d’inclusion n’en suscite pas né¬ 
cessairement une autre, paraît une carte forcée pour légitimer a poste¬ 
riori un état de fait». 

Est-il dès lors impossible d’évaluer de manière valide les capacités lo¬ 
giques des sujets ? Nous ne pouvons en effet évaluer un raisonnement pur. Ce¬ 
lui-ci s’applique toujours à un contexte particulier qui influence positivement 
ou négativement les performances des sujets. Comme nous ne pouvons élimi¬ 
ner cette influence du contexte, la seule solution est de suivre la proposition 
de Messick et de «transcontextualiser» notre évaluation. Seule la consistan¬ 
ce des performances au travers de différents contextes peut être prise comme 
un indicateur valide du niveau de compétence des élèves. Ce point de vue sur 
la démarche évaluative est d’ailleurs celui qui est défendu par Meljac (1980, p. 
53) qui souligne l’importance pour le diagnostic de « la cohérence interne des 
réussites de l’enfant». 

La question du contexte renvoie à une limite fondamentale du modèle 
piagétien. Comme nous l’avons déjà souligné, Piaget n’est pas psychologue 
mais avant tout philosophe de la connaissance et logicien. Son point de vue sur 
le développement cognitif est normatif. Il essaie en effet, tout au long de son 
oeuvre, de définir les normes logiques nécessaires à la construction et à l’évo¬ 
lution de la connaissance. Mais en procédant de la sorte, Piaget néglige les 
conditions socio-culturelles et spécifiquement psychologiques qui influencent 
inévitablement la construction du nombre. Il le reconnaît d’ailleurs 
clairement : «Il va de soit qu’avant de chercher à traduire la chose sous 
une forme statistique et d’appliquer à ces épreuves les diverses formules 
de corrélations du calcul des probabilités, il faudrait résoudre aupara¬ 
vant des questions pour lesquelles nous avouons n’avoir aucun intérêt : 
tel problème d’ordination dont nous nous sommes servis est-il exacte¬ 
ment de difficulté égale à tel autre ou à tel problème de cardination, in¬ 
dépendamment de l’ordination et de la cardination elle-même ? Il est 
clair en effet, qu’en chaque épreuve intervient une foule de facteurs hé¬ 
térogènes, tels les mots employés, la longueur de la consigne, son carac¬ 
tère plus ou moins concret, ses relations avec l’expérience individuelle 
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du sujet, le nombre des objets considérés, l’intervention de la numéra¬ 
tion apprise, etc., etc. » (Piaget & Szeminska, 1941, p.193). 

Si, pour le logicien, l’aspect pragmatique de la connaissance est sans 
doute peu important, il n’est est pas de même pour le psychologue et l’ensei¬ 
gnant. Le but de ces derniers n’est pas de construire un modèle général du su¬ 
jet épistémique mais d’agir avec un sujet concret dans un contexte particulier. 
Cette différence de niveau d’approche de la construction de la pensée permet 
de comprendre le relatif échec de l’application des épreuves piagétiennes 
dans les situations concrètes d’évaluation. 

La solution n’est toutefois pas de rejeter le modèle piagétien du nom¬ 
bre dont nous avons pu souligner la valeur mais, plutôt, de le réformer. Il s’agit 
en effet d’y introduire le sujet réel et son contexte et d’élaborer ce que Bi- 
deaud & Houdé (1991, p.90) appellent «un constructivisme-en-contextes » 
où seraient articulés le contexte pragmatique et le contexte normatif. Les dé¬ 
veloppements récents de la psychologie cognitive nous offrent les outils con¬ 
ceptuels pour nous permettre de réaliser cet élargissement du modèle 
constructiviste classique. 

3.2 Les approches cognitivistes 

3 . 2.1 Apports des modèles cognitivistes 

Comme le souligne Richelle (1993, p.93), «il n’y a pas un cognitivis- 
me, il y a des variantes de cognitivismes». Sont regroupés sous un même 
terme des modèles théoriques parfois très différents mais qui se rejoignent 
par une volonté commune de dépasser le behaviorisme en étudiant le traite¬ 
ment de l’information qui est réalisé entre le stimulus et la réponse. Assez cu¬ 
rieusement, la plupart des auteurs cognitivistes qui travaillent sur les 
apprentissages mathématiques ne font aucune référence à Piaget. Pourtant le 
point de vue piagétien, s’il est d’évidence moins «psychologique », n’est pas en 
contradiction avec celui des cognitivistes. Il est, au contraire, une source d’in¬ 
formations essentielle pour nous aider à comprendre certaines erreurs et cer¬ 
taines difficultés d’apprentissage en mathématique. Comme nous le verrons 
plus loin cette ignorance des travaux piagétiens conduit certains chercheurs 
à redécouvrir ce qui avait déjà été mis en évidence cinquante ans plus tôt par 
Piaget et ses collaborateurs. 

Par rapport au point de vue piagétien, les approches cognitivistes sont 
plus soucieuses de comprendre le sujet réel en contexte. Ainsi, lorsqu’ils étu¬ 
dient la résolution de problèmes exprimés verbalement, les chercheurs veu¬ 
lent comprendre le traitement par le sujet de l’information dans toute sa 
complexité, sans se limiter à saisir les seules composantes opératoires. Ils tien¬ 
nent dès lors compte de la coordination par le sujet de différentes 
connaissances : mathématiques, linguistiques, factuelles... Les chercheurs 
sont également plus attentifs aux représentations et aux types de connaissan¬ 
ces utilisés par les sujets. En particulier, la distinction entre les connaissances 
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déclaratives et procédurales ainsi que les transformations de l’une en l’autre 
ont été largement appliquées pour décrire l’évolution des connaissances ma¬ 
thématiques. Ceci va de pair avec une grande attention portée au degré 
d’automatisation des procédures; laquelle est évaluée en terme de vitesse de 
traitement et/ou de résistance aux interférences d’autres tâches réalisées si¬ 
multanément. Cette attention rejoint celle, plus large, portée aux contraintes 
du système cognitif : la capacité limitée de la mémoire de travail, la nécessité 
de pouvoir ignorer les informations non pertinentes et d’inhiber les procédu¬ 
res incorrectes... 

3.2.2 Modèles en composantes et évaluation 

Plusieurs modèles cognitivistes proposent des représentations du 
fonctionnement cognitif sous forme d’une organisation de composantes, cha¬ 
cune responsable d’un traitement spécifique de l’information. Ces modèles en 
composantes constituent des outils conceptuels importants pour l’évaluation 
diagnostique. Ils représentent un guide pour la démarche évaluative et une ré¬ 
férence pour l’interprétation des performances observées. Dans la présente 
section, nous présenterons deux de ces modèles. Le premier concerne la ré¬ 
solution de problèmes. Le second, développé dans le cadre de la neuropsycho¬ 
logie cognitive, est plus focalisé et ne concerne que l’arithmétique 
élémentaire. 

A. LA RÉSOLUTION DE PROBLÈMES 

Mayer (1985) distingue quatre étapes dans le traitement d’un problè¬ 
me mathématique : 

1. La traduction du problème 

Chaque proposition du problème est traduite en une représentation 
interne. Cette traduction suppose des connaissances linguistiques et des con¬ 
naissances factuelles (par exemple, qu’une livre de beurre vaut 500 gram¬ 
mes). On constate que les jeunes enfants ont souvent de difficultés à se 
représenter des propositions relationnelles (Riley & al., 1982); par exemple : 
«Jean a 3 billes, Paul a 5 billes de plus que Jean. Combien Paul a-t-il de 
billes ?». Souvent les enfants se font une représentation statique de la situa¬ 
tion (Paul à 5 billes) et non dynamique (billes de Paul = 5 + billes de Jean). 

2. L'intégration du problème 

Les propositions du problème sont mises ensemble au sein d’une re¬ 
présentation cohérente. Ceci suppose la connaissance de schémas, c’est-à- 
dire de formes typiques de problèmes. Partant de l’énoncé linguistique, cette 
intégration n’est pas toujours simple. Par exemple, les trois énoncés suivants 
doivent conduire à la même opération arithmétique (3+5=...) mais le premier 
se révèle beaucoup plus simple à intégrer que les deux suivants : (a) «Jean a 
3 billes. Paul lui en donne 5 de plus. Combien de billes Jean a-t-il à 
présent ?» ; (b) «Jean a 3 billes. Paul a 5 billes. Combien de billes ont-ils 
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ensemble ?»; (c) «Jean a 3 billes. Paul a 5 billes de plus que Jean. Com¬ 
bien Paul a-t-il de billes ?». 

3. La planification de la solution 

Le sujet élabore une stratégie de résolution du problème qu’il a traduit 
en un énoncé mathématique. Par exemple, lors de l’apprentissage de l’algèbre, 
les élèves acquièrent une connaissance stratégique relative à la hiérarchie des 
opérations à effectuer : d’abord les parenthèses, puis les puissances, ensuite 
les multiplications et divisions et, enfin, les additions et soustractions. 

4. L'exécution de la solution 

Les calculs sont réalisés selon la stratégie choisie. Par exemple (Groen 
& Parkman, 1972), on peut résoudre une addition en : (a) recomptant tout; 
(b) comptant à partir du premier nombre de l’énoncé; (c) comptant à partir 
du plus grand nombre. Chez les sujets plus âgés, le calcul peut être évité par 
le rappel de «faits arithmétiques», c’est-à-dire de résultats d’opérations fré¬ 
quentes mémorisés au cours du temps. 

Un tel modèle est intéressant pour le diagnostic car il permet de 
mieux situer les difficultés du sujets sans se limiter à l’aspect strictement ma¬ 
thématique de la résolution d’un problème. Ce modèle a par ailleurs le mérite 
d’attirer l’attention sur deux facettes importantes de la résolution de 
problèmes : (1) le passage du «nombre de» au «nombre» et (2) l’importance 
des caractéristiques mnésiques du sujet. 

Dans la vie quotidienne, nous ne rencontrons que des «nombres de», 
c’est -à-dire des quantités (30 litres d’essences, 600 grammes de viandes, 8 
pommes, 245 francs...). Ces quantités, qui peuvent être discrètes ou conti¬ 
nues, ne peuvent être traitées directement au niveau arithmétique. Pour ce 
faire, nous devons faire abstraction des qualités sensibles des objets et ne plus 
conserver que leur caractère d’unité. Comme le fait remarquer Popper (cité 
par Jonnaert, 1994, p.253), au niveau physique, deux gouttes plus deux gout¬ 
tes ne font pas quatre gouttes dans une bouteille. Et un lapin plus un lapin 
peut donner plus de deux lapins. Par contre, au niveau mathématique, 2 + 2 
fait toujours 4 en vertu des définitions de «2», «4», « + » et « = ». En fait, 
l’énoncé 2+2=4 est une tautologie puisque nous affirmons simplement qu’une 
certaine manière d’écrire les choses est équivalente à une autre. Le passage 
du monde physique au monde mathématique est souvent source de difficultés 
pour les enfants qui se dégagent avec peine des apparences sensibles. Par 
ailleurs, les nombres étant par nature abstrait, se produit une rupture dans le 
traitement des problèmes. II y a là danger de perte de sens. Le sujet entre dans 
un monde qui lui paraît mystérieux, voire magique. Il applique des algorithmes 
sans trop les comprendre et produit une solution absurde au regard de la réa¬ 
lité. 


Le modèle présenté attire également l’attention sur les contraintes de 
fonctionnement du système cognitif. La capacité de la mémoire de travail est 
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en effet limitée. Comme il est nécessaire de traiter séquentiellement les infor¬ 
mations, la vitesse de ce traitement doit être suffisante si l’on veut éviter 
d’oublier les résultats intermédiaires en mémoire de travail. Ces contraintes 
n’ont été guère prises en compte par Piaget. Pourtant, dans la réalité du cal¬ 
cul, on constate que les sujets qui n’ont pas suffisamment stocké de faits 
arithmétiques en mémoire à long terme surchargent leur mémoire de travail 
par de nombreuses opérations intermédiaires. La charge mentale de la résolu¬ 
tion d’un problème arithmétique est évidemment moindre si le sujet a déjà en 
mémoire le résultat des additions et des multiplications les plus fréquentes. 

B. L'arithmétique 

Les travaux réalisés dans le domaine de la neuropsychologie cognitive 
sont également une source intéressante de connaissances à propos des com¬ 
posantes qui interviennent dans le traitement de problèmes mathématiques. 
En nêuropsychologie cognitive, les patients atteints d’une lésion cérébrale 
sont analysés moins dans le but de mettre à jour l’origine neurologique d’un 
dysfonctionnement mental que de comprendre la cognition humaine normale. 
Dans cette perpective, un trouble est conçu comme «le résultat visible d’un 
système de traitement de l’information au sein duquel certaines compo¬ 
santes du traitement sont soit devenues dysfonctionnelles soit se trouvent 
déconnectées des autres composantes» (Seron, 1991). Cette conception 
des choses s’appuie sur le postulat d’une autonomie fonctionnelle des diffé¬ 
rentes composantes et donne lieu à une démarche d’évaluation diagnostique 
qui consiste à tester systématiquement le fonctionnement des différentes 
composantes du modèle. 

Bien que développés à partir d’étude de cas d’adultes souffrant de dé¬ 
ficits acquis des fonctions cognitives, les modèles neuropsychologiques peu¬ 
vent être également utiles pour comprendre les troubles d’apprentissage. Ces 
modèles offrent en effet une représentation de l’organisation du fonctionne¬ 
ment cognitif normal, laquelle se construit progressivement au cours des ap¬ 
prentissages. Elle peut dès lors constituer une référence pour l’évaluation 
diagnostique des enfants. 

Dans le domaine mathématique, plusieurs modèles ont été proposés. 
Actuellement, le modèle à la fois le plus élaboré et le plus opérationnel est 
dans doute celui de Mc Closkey (1992). Ce modèle (figure 1) se présente sous 
la forme d’une architecture de trois systèmes : (1) un système de compréhen¬ 
sion des nombres, (2) un système de calcul et (3) un système de production 
des nombres. Les systèmes de compréhension et de production sont caracté¬ 
risés par une structure semblable. Il contiennent tous les deux un sous-systè¬ 
me verbal et un sous-système de nombres arabes. Une même représentation 
sémantique de la valeur du nombre est produite quel que soit le code d’entrée 
ou de sortie. Le système de calcul est lui divisé en (1) un sous-système d’in¬ 
terprétation des symboles qui précisent l’opération à effectuer; (2) un sous- 
système de recherche de faits arithmétiques (par exemple, les tables de mul¬ 
tiplication) et (3) un sous-système d’exécution des calculs activé lorsque la 



La mathématique 


réponse ne se trouve pas dans le stock de faits arithmétiques. Ces différents 
sous-systèmes permettent de distinguer, au sein des connaissances arithmé¬ 
tiques, les connaissances déclaratives et les connaissances procédurales. 



Figure 1 

Modèle du traitement des nombres et du calcul selon McCloskey 

Nous pouvons illustrer le fonctionnement de cette organisation modu¬ 
laire par l’exemple du traitement d’un calcul arithmétique. Imaginons un élève 
qui doit résoudre le calcul «5+6» qu’il vient de lire au tableau. Les étapes du 
traitement seront les suivantes : 

1. dans le système de compréhension, cinq et six sont transformés en 
des quantités abstraites par le composant lexical du sous-système 
des nombres arabes. 

2. dans le système de calcul, le sous-système d’interprétation des sym¬ 
boles identifie l’opérateur de l’addition. Ensuite, le résultat est 
recherché dans le stock des faits arithmétiques. 

3. dans le système de production, la représentation du résultat est 
transformée dans la forme phonologique adéquate. L’élève peut alors 
émettre sa réponse oralement. 

Comme le souligne Seron (1994, p. 443) : «La valeur heuristique du 
modèle est évidente car il permet d’analyser de manière relativement 
précise quelle composante se trouve déficitaire». Sur cette base, il est pos¬ 
sible de créer des tâches spécifiques afin de déterminer quelles sont les com- 
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posantes efficientes et celles qui sont déficitaires. L’interprétation des 
résultats ne se fait pas épreuve par épreuve mais sur base des prédictions 
coordonnées qui peuvent être faites à l’aide du modèle. 

3.2.3 Limites des démarches diagnostiques cognitivistes 

Les travaux réalisés en psychologie cognitive ont généré des modèles 
intéressants pour l’évaluation diagnostique. Toutefois, en se focalisant sur les 
procédures, ces modèles négligent souvent l’objet sur lequel portent les opé¬ 
rations mathématiques : le nombre. Or, c’est la compréhension de la structure 
profonde de ce dernier qui permet au sujet de choisir la stratégie de résolution 
la plus adéquate et de contrôler la valeur logique de la solution trouvée. Par 
exemple, lorsqu’il opère sur les entiers naturels, l’élève qui soustrait un nom¬ 
bre d’un autre ne peut trouver comme solution une différence qui soit plus 
grande que les termes de celle-ci. De même, l’élève qui résout l’addition 
«3+5=... » en comptant à partir du plus grand nombre démontre ainsi sa com¬ 
préhension de la loi de commutativité de l’addition, selon laquelle A+B = B+A. 
Or la compréhension de cette loi «exige à la fois toute la structure de la pen¬ 
sée opératoire, et toute la structure du nombre proprement dit» (Gréco, 
1962, p.226). 

Peu attentifs à la construction des structures logiques sous-jacentes à 
la résolution des problèmes mathématiques, certains chercheurs se perdent 
ainsi dans des explications qui ne touchent qu’à la périphérie de la question. 
Par exemple, Stem (1993) tente de comprendre pourquoi le problème «Jean 
a 7 oeufs. Il a 4 oeufs déplus que Pierre. Combien d’oeufs Pierre a-t-il ?» 
est beaucoup plus difficile pour les enfants que le problème «Jean a 7 oeufs. 
Pierre en a 4 de moins que Jean. Combien d’oeufs Pierre a-t-il ?». Diffé¬ 
rentes expériences sont conduites afin de déterminer la source de cette diffi¬ 
culté. On observe que pour résoudre le problème, le sujet peut simplement 
transformer le premier énoncé dans la forme du second. L’auteur explique que 
cette transformation requière «une flexibilité dans l’usage du langage dé¬ 
crivant les quantités» (Stern, 1993, p. 21). Elle reconnaît toutefois que le 
manque de flexibilité du langage peut être dû au fait que, pour le jeune enfant, 
l’addition et le soustraction sont compris comme des processus indépendants 
et non comme des opérations réciproques. Et elle ajoute :«Les relations en¬ 
tre addition et soustraction ne peuvent être elles-mêmes comprises qu’au 
moment où les nombres sont représentés en termes de relations entre les 
parties et le tout» (p.21). Cette observation est pour le moins surprenante. 
En effet, l’auteur, qui semble ignorer totalement les travaux de Piaget, est 
conduite à redécouvrir de manière embryonnaire les fondements opératoires 
du nombre et des opérations décrites à Genève voici plusieurs décennies. Ce 
bref exemple illustre combien il est difficile de faire l’économie de l’apport pia- 
gétien pour la compréhension et l’évaluation des premiers apprentissages ma¬ 
thématiques. La résolution de problèmes mathématiques n’est pas 
uniquement affaire de procédure, elle est également guidée par les exigences 
d’un système opératoire qui se construit petit à petit au cours de l’enfance. 
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Par ailleurs, les modèles développés actuellement en psychologie co¬ 
gnitive sont généralement fort restreints, ne concernant que la résolution de 
certaines tâches bien précises. Chaque modèle local est utilisé pour étudier un 
problème spécifique à l’aide d’épreuves créées pour cette unique fonction. Ces 
modèles locaux constituent des «minithéories» (Richelle, 1993, p.221) qui 
ne sont généralement pas articulées entre elles. Or nous ne pouvons exclure 
que certains troubles d’apprentissage soient dus à des problèmes transver¬ 
saux dont le retentissement concerne le fonctionnement cognitif de manière 
globale. Ces problèmes transversaux peuvent, par exemple, concerner l’atten¬ 
tion ou de le fonctionnement mnésique. Or les modèles en composantes ont 
quelques difficultés à intégrer des variables d’ordre plus général. Il y a dès lors 
un risque de réductionnisme à vouloir s’enfermer dans un modèle local sensé 
rendre compte de toutes les facettes des compétences mathématiques. 


Conclusion 

Après ce passage en revue des différentes approches du diagnostique 
des apprentissages mathématiques, quelle démarche d’évaluation diagnosti¬ 
que pouvons nous retenir ? Nous avons pu constater que les démarches cen¬ 
trées sur les compétences, qu’elles soient d’inspiration piagétienne ou 
cognitiviste, nous apportent des informations plus riches et plus intéressantes 
pour les actions rééducatives que les démarches d’évaluation centrées sur les 
performances. Malheureusement, les premières sont nettement plus comple¬ 
xes et plus coûteuses en temps que les secondes. C’est pourquoi, nous pen¬ 
sons que les évaluations normatives centrées sur les performances gardent 
une place dans l’examen diagnostique. Elles permettent en effet de réaliser un 
passage en revue rapide de la situation de l’élève. En cas de problème, une in¬ 
vestigation plus approfondie peut alors être conduite dans un secteur précis 
des apprentissages. 

Par ailleurs, le développement de modèles cognitivistes n’implique 
pas que le modèle piagétien soit aujourd’hui dépassé. Chaque modèle apporte 
des informations spécifiques pour permettre de comprendre les caractéristi¬ 
ques du fonctionnement mental sous-jacent aux performances observées. Le 
modèle piagétien nous offre un cadre conceptuel particulièrement solide pour 
comprendre la construction du nombre par l’enfant. Tout d’abord, il attire no¬ 
tre attention sur la maîtrise d’opérations qui constituent les racines du con¬ 
cept de nombre. Ensuite, il met l’accent, au travers de la notion de 
groupement, sur la coordination progressive des opérations. Ce groupement 
des opérations est dirigé par la nécessité interne d’équilibre, c’est-à-dire de 
cohérence. Les différentes opérations forment ainsi un système dont découle 
la rigueur logique de la pensée. L’existence d’un tel groupement d’opérations 
nous permet de comprendre, entre autres, les relations logiques qui existent 
entre le concept de nombre et les différentes opérations arithmétiques. C’est 
en ce sens que l’on peut considérer le modèle piagétien du nombre comme un 
système normatif. 
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Mais l’élève confronté à des problèmes mathématiques n’est pas seu¬ 
lement un petit logicien. Il est aussi un sujet en contexte. Par conséquent, 
l’évaluation des capacités cognitives liées aux apprentissages mathématiques 
ne peut se limiter aux capacités opératoires. Les cognitivistes ont démontré la 
nécessité de prendre en compte d’autres caractéristiques de la pensée, en par¬ 
ticulier la manière dont les connaissances sont représentées en mémoire. Par 
ailleurs, ils attirent l’attention sur les contraintes de fonctionnement du systè¬ 
me cognitif. Par exemple, le fait que la mémoire de travail ait une capacité li¬ 
mitée nous conduit à évaluer le degré d’automatisation de certaines 
connaissances. Ces apports de la psychologie cognitive n’entrent pas en con¬ 
flit avec une évaluation piagétienne des compétences mathématiques. Ils vien¬ 
nent, au contraire, utilement la compléter. 
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Introduction 

L’évaluation d’un apprentissage requiert la prise en compte de trois 
facteurs : le niveau préalable des enfants, le contenu même de l’apprentissage 
du point de vue des connaissances et des procédures réellement engagées et, 
enfin, le critère d’acquisition retenu (effet à cours ou à long terme, générali¬ 
sation à des situations analogues etc...)- L’estimation du niveau préalable est 
à l’évidence nécessaire, et cela en amont comme en aval. En amont elle permet 
d’orienter la mise en oeuvre de situations d’entraînement pertinentes. En aval 
elle assure une estimation plus exacte des effets d’apprentissage et une com¬ 
préhension plus fine des erreurs. L’objectif de cet exposé est de montrer l’im¬ 
portance d’une évaluation la plus exhaustive possible des capacités 
«mathématiques» des jeunes enfants dans leur appropriation de la chaîne nu¬ 
mérique verbale, la maîtrise des propriétés de cette séquence étant la condi¬ 
tion sine qua non d’un bon apprentissage de l’arithmétique élémentaire. 

La diversité des données expérimentales qui concernent la construc¬ 
tion et l’utilisation du nombre chez l’enfant est extrême. Elle rend compte de 
la diversité des conquêtes cognitives qui jalonnent le développement dans ce 
domaine. C’est en ce sens que l’on peut parler d’une psychogenèse polymor¬ 
phe ou encore avec Droz (1991 p. 299) «...des psychogenèses des notions re¬ 
latives aux nombres naturels». Cette complexité, qui semble bien être la règle, 
ne facilite guère l’estimation des compétences numériques à un moment don¬ 
né du développement. La difficulté est d’autant plus grande que la nature des 
conduites observées est diversement interprétée selon les points de vue théo¬ 
riques et le rôle attribué aux contextes extra et/ou intra-scolaires d’acquisi¬ 
tion. 


Dans la première partie de cette contribution, j’essaierai de montrer 
comment un regard à la fois critique et synthétique sur les traits essentiels des 
théories les plus marquantes permet, compte tenu des faits expérimentaux 
disponibles, de guider plus sûrement les investigations. La seconde partie sera 
consacrée à l’exposé de trois études empiriques des capacités numériques 
d’enfants de 4 à 6 ans, retenues parce qu’elles sont les seules d’importance 
certaine et parce que l’analyse de leurs résultats conduit à des hypothèses 
constructives. Dans la troisième partie je tenterai de montrer l’importance des 
contextes dans l’estimation des niveaux préalables et, partant, dans celle des 
effets d’apprentissages. 


1. UN REGARD SUR LES THÉORIES 
1.1 La théorie piagétienne 


Selon Piaget, la maîtrise du nombre n’est atteinte que lorsque l’enfant 
synthétise en un seul groupe les opérations de classification et de sériation. Il 
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est facile et courant de «malmener» la pensée piagétienne : aussi pour plus de 
précision citons-nous Piaget lui-même (1947, pp.169-170). : 

«Sans doute le jeune enfant n’attend pas cette génération opéra¬ 
toire pour construire les premiers nombres... mais les nombres de 1 à 6 
sont encore intuitifs, parce que liés à des configurations perceptives. 
D’autre part on pourra apprendre à l’enfant à compter, mais l’expérien¬ 
ce nous a montré que l’usage verbal des noms de nombre reste sans grand 
rapport avec les opérations numériques elles-mêmes, celles-ci précédant 
parfois la numération parlée ou lui succédant sans lien nécessaire. 
Quant aux opérations constitutives du nombre, c’est à dire à la corres¬ 
pondance bi-univoque (avec conservation de l’équivalence obtenue, mal¬ 
gré les transformations de la figure) ou a l’itération simple de l’unité 
(1+1 = 2; 2+1 =3 etc...), elles ne requièrent pas autre chose que les groupe¬ 
ments additifs de l’emboîtement des classes et de la sériation des rela¬ 
tions asymétriques (ordre), mais fondus en un seul tout opératoire, tel 
que l’unité 1 soit simultanément élément de classe (1 compris dans 2; 2 
en 3 etc...) et de série (le premier 1 avant le deuxième 1 etc...). Tant que 
le sujet envisage les éléments individuels dans leur diversité qualitative 
il peut, en effet, ou les réunir selon leurs qualités équivalentes (il cons¬ 
truit alors des relations de classes) ou les ordonner selon leurs différen¬ 
ces (il construit alors des relations asymétriques) mais il ne peut les 
grouper simultanément en tant qu’équivalents et que différents. Le nom¬ 
bre est au contraire une collection d’objets conçus comme à la fois équi¬ 
valents et sériables, leurs différences se réduisant alors à leur position 
d’ordre : cette réunion de la différence et de l’équivalence suppose en ce 
cas l’élimination des qualités, d’où précisément la constitution de l’unité 
homogène 1 et le passage du logique au mathématiques». 

La citation est longue, mais tout y est : la logique sous-jacente, l’abs¬ 
traction nécessaire et le bien fondé de l’épreuve de conservation numérique. 

Il est évident que la perspective est incomplète. L’enfant baigne dans 
un environnement chiffré et les pratiques sociales guident et orientent sa con¬ 
quête du nombre. Il est évident aussi que l’enfant quantifie avant de compter 
et que la théorie sous estime ce tremplin (Vilette, 1993,1994). Mais il est non 
moins évident que la conservation de la quantité, en dépit de transformations 
qui la laisse invariante, reste un des critères sûrs de la compétence numéri¬ 
que. On rappelle que, dans l’épreuve piagétienne de conservation, 6 à 8 jetons 
sont alignés devant l’enfant à qui l’on demande de placer sur la table autant de 
jetons pris dans un tas d’une autre couleur. Vers 4 ans, l’enfant construit gé¬ 
néralement, en serrant plus ou moins les jetons, une rangée de même lon¬ 
gueur que celle de la rangée-modèle. Plus tard, l’enfant met en 
correspondance terme à terme les jetons des deux rangées. Mais si l’adulte 
éloigne le dernier jeton de la rangée initiale, l’enfant dénie l’équivalence et ra¬ 
joute un ou plusieurs jetons à la sienne. Vers 5-6 ans, il convient de l’équiva¬ 
lence des quantités quelles que soient les transformations apparentes 
opérées. Il est alors «conservant». Gréco (1962), bien avant Gelman (1982), 
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Gelman et Meck (1983, 1991), observe, lors d’une épreuve où, chacun d’un 
côté de l’écran, l’adulte et l’enfant mettent en correspondance cinq ou six je¬ 
tons comptés, que l’invariance numérique est maintenue précocement («cela 
fait 6 et 6», par exemple). Mais l’écran enlevé, l’invariance de la quantité est 
cependant réfutée, avant 5-6 ans, si la correspondance spatiale terme à terme 
n’est pas respectée. La conservation de la quantité comptée (avec écran), ap¬ 
pelée par Gréco conservation de la quotité , serait l’indice d’un niveau fruste 
de cardinalité si elle n’est pas assortie de la conservation de la quantité en de¬ 
hors du comptage. Sans cela le cardinal ne serait qu’un label de surface. Con¬ 
servation de la quotité, de la quantité, compréhension de l’ordre serial et de 
l’inclusion hiérarchique des nombres devraient être nécessairement inclues 
dans une évaluation des compétences de l’enfant. 

1.2 L'innéisme de Gelman 

La théorie est bien connue et je n’en rappelle ici que les traits spécifi¬ 
quement intéressants pour l’exposé. 

De nombreuses observations ont fait état de connaissances 
«mathématiques» diverses chez le jeune enfant. En témoignent les situations 
où certaines contraintes liées à l’exécution et au contrôle de l’action sont le¬ 
vées. Un exemple est celui où l’on demande à l’enfant d’évaluer le caractère 
correct ou incorrect de procédures de comptage effectuées par une poupée : 
à 3-4 ans la majorité des enfants distinguent parfaitement un comptage cor¬ 
rect (avec ou sans pseudo-erreurs) d’un comptage erroné (Gelman et Meck, 
1983). A cet âge, les connaissances « mathématiques » des jeunes enfants sem¬ 
blent dépasser d’assez loin celles qui se manifestent lors de situations plus 
contraignantes. Des observations de ce genre conduisent Gelman à postuler 
l’existence de compétences implicites dont l’enfant disposerait dès son plus 
jeune âge. Ces compétences sont décrites sous forme de cinq principes rap¬ 
portés dans le tableau 1. Il s’agit là de capacités potentielles dont un ensemble 
assez impressionnant de recherches expérimentales tendrait à confirmer 
l’existence (voir Gelman, 1982; Gelman et Meck, 1983, 1991...). 

Cependant, de nombreuses données empiriques mettent en doute 
l’existence de principes définis aussi précisément que ceux de Gelman. Un 
bon exemple en est la recherche de Briars et Siegler (1984) concernant le 
principe de correspondance mot-nombre/objet et le principe de non pertinen¬ 
ce de l’ordre (principes 2 et 5 du tableau 1) qui porte sur des enfants de 3,4 et 
5 ans. La situation adaptée de Gelman et Meck (1983) est celle de \à poupée 
qui compte en utilisant trois types de procédures : 1/ le comptage erroné avec 
violation de la correspondance mot-nombre/objet; 2/ le comptage correct mais 
inhabituel (comptage d’éléments non adjacents, comptage de droite à gauche 
ou à partir de la rangée); 3/ le comptage standard de gauche à droite. Les en¬ 
fants doivent juger du caractère correct ou incorrect des procédures. Les ré¬ 
sultats révèlent que la correspondance mot-nombre/objet n’est vraiment 
acceptée qu’à 4 ans. La compréhension de la nature essentielle de cette règle 
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se développerait entre 3 et 5 ans sans être encore complètement atteinte à 5 
ans. A cet âge, en effet, les enfants rejettent encore, dans leur majorité, les 
procédures correctes mais inhabituelles (comptage des éléments non adja¬ 
cents par exemple). Par ailleurs, Briars et Siegler testent l’hypothèse d’une 
antériorité du comptage correct sur la règle de correspondance. Les résultats 
observés montrent que 11 des 16 enfants de 3 ans de l’échantillon comptent 
eux-mêmes correctement sans pour autant rejeter de manière stable les vio¬ 
lations de la règle de correspondance effectuées par la poupée tandis que tous 
les enfants qui les rejettent (n=5) comptent correctement. Le comptage 
«social» semble bien précéder l’utilisation et la compréhension des principes 
répertoriés par Gelman (voir aussi Baroody, 1991). 

Tableau 1 

Les principes fondamentaux du comptage selon Gelman et Gallistel (1978) 


1. Principe d'ordre stable : les mots-nombres doivent être engendrés dans 
le même ordre à chaque comptage. 

2. Principe de stricte correspondance terme à terme : chaque élément 
d'une collection doit être désigné par un mot-nombre et un seul. 

3. Principe cardinal : le mot-nombre qui désigne le dernier élément d'une 
collection représente le nombre total d'éléments. 

4. Principe d'abstraction : seules sont abstraites, des éléments comptés, 
leurs caractéristiques d'entités distinctes 

5. Principe de non pertinence de l'ordre : l'ordre dans lequel les éléments 
d'une collection sont énumérés n'affecte pas le résultat du comptage à 
condition que le principe de correspondance terme à terme soit respecté 


Le principe de cardinalité a fait également l’objet de vives controver¬ 
ses. Réfutant le subitziting, ou aperception globale de la numérosité de petites 
collections, Gelman et Meck (1991) créditent de l’utilisation du principe car¬ 
dinal (principe 3 du tableau 2)»...les enfants qui se servent d’un seul terme 
pour évoquer -soit en réponse à une question, soit spontanément- la numéro¬ 
sité de la collection» (ibid., p.227). Sur de petites collections de’3 et 4 élé¬ 
ments, Gelman et Meck observent, avec ces critères, l’application du principe 
cardinal chez respectivement 7 et 8 sur 12 enfants de 2 et 3 ans. Mais selon 
Fuson (1991) et Sophian (1991), le comptage ne débouche pas d’emblée sur 
un résultat cardinal. Il s’agirait d’une imitation de la conduite adulte. La «règle 
du dernier mot» serait apprise procéduralement avant la compréhension de 
ses implications cardinales. Comptage et cardinalité seraient dissociés et ne 
s’intégreraient que progressivement. Une récente recherche de Grégoire et 
Van Nieuwenhoven (1993, voir aussi ci-dessous) indique que les principes de 
Gelman ne sont pas encore réellement intégrés à 5 et 6 ans. 

En dépit des critiques nombreuses et d’observations, qui conduisent 
pour le moins à la moduler, la perspective de Gelman reste intéressante à dou- 
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ble titre. Tout d’abord elle peut expliquer les différences inter et intra-indivi- 
duelles. A partir du moment où des compétences bien définies existent, les 
variations pourraient renvoyer à deux sources d’erreurs mentionnées par Gel- 
man etMeck (1991, p. 220) :«...(a) une compétence procédurale inadéquate 
au niveau de l’établissement des plans d’actions; (b) une compétence inter¬ 
prétative limitée...» (compréhension de la consigne, etc.). Le second intérêt 
réside dans l’essor donné à l’étude des activités numériques précoces et par¬ 
ticulièrement à celle du comptage. 

Quelles que soient les critiques, dont le bien fondé paraît certain, l’ap¬ 
port de Gelman réside dans l’accent mis sur des principes, bien déterminés et 
différenciés, que l’enfant qui apprend à compter doit intégrer. D’où l’impor¬ 
tance d’évaluer leur niveau d’élaboration. Le principe de cardinalité renvoie-t- 
il, par exemple, à la même organisation cognitive (représentation et opéra¬ 
tion) entre 4 et 8-9 ans ? 

1.3 Le constructivisme de Fuson et de Steffe 

Deux activités doivent être coordonnées lors du dénombrement des 
éléments d’une collection : la production d’une série ordonnée de mots-nom¬ 
bres et l’application de chacun de ces mots-nombres à un seul des éléments 
de la collection, en évitant les omissions et les répétitions. Si cette coordina¬ 
tion se développe progressivement entre 2 et 6 ans pour la numération élé¬ 
mentaire, il faut attendre 8-9 ans et plus pour qu’elle soit effectivement 
maîtrisée. A partir d’observations multiples et précises, Fuson (Fuson, 1988, 
Fuson 1991) distingue quatre niveaux d’élaboration de la chaîne numérique 
qui correspondent aux étapes mises en évidence par Steffe (1991). Ces ni¬ 
veaux, répertoriés dans le Tableau 2, sont brièvement décrits ci-dessous. 

Tableau 2 

La chaîne numérique verbale : les étapes du développement (d'après Fuson, 1991 
et Steffe, 1991) 


Niveau 1 


- 1e «chapelet» 

Fuson 

- le schème de comptage perceptif 

Steffe 

Niveau 2 


- la chaîne insécable 

Fuson 

- le schème de comptage figuratif 

Steffe 

Niveau 3 


- la chaîne sécable 

Fuson 

- la suite initiale des nombres 

Steffe 

Niveau 4 


- la chaîne terminale : suite numérique, emboîtée, sériée, 


cardinalisée et «unitisée» 

Fuson 

- la suite tacitement puis explicitement emboîtée 

Steffe 
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1. Le niveau du chapelet. L’enfant produit une suite compacte de dési¬ 
gnations sans signification numérique : un-deux-trois... qui se produit 
aussi dans les comptines. Elle conduit à l’appréhension précoce de 
petites numérosités basées sur des configurations perceptives ( subi - 
tizing, schème perceptif de comptage). 

2. La chaîne insécable, figurative. La caractéristique de cette étape est 
l’incapacité de compter à partir d’un nombre donné : l’enfant doit 
revenir à un, la chaîne est insécable. Selon Steffe (1991, p.123), 
l’usage d’une suite de mots-nombres renvoie à un enregistrement 
de l’aspect kinesthésique (patterns digitaux) ou auditif. En dépit de 
cette restriction, cette phase, qui peut se développer jusque 5-6 ans 
selon les enfants, est celle du mot-nombre signifiant le comptage 
par opposition à la précédente où le mot-nombre signifie la confi¬ 
guration. La capacité notable qui émerge est celle du comptage 
jusqu’à un nombre donné (vers 4 ans). 

3. La chaîne sécable. A ce niveau les enfants comptent à partir de 
n’importe quel nombre donné et de n’importe quel nombre à un 
autre. Le comptage à rebours se développe également ainsi que la 
capacité à répondre à la question «Qu’est-ce qui vient avant n ?» 
Le comptage est contrôlé parce que, selon Steffe (1991, p.126), les 
éléments de la série renvoient à l’intériorisation des opérations réali¬ 
sées lors des comptages perceptifs et figuratifs. Le nombre prend 
alors le statut de symbole dans la suite initiale progressivement 
arithmétisée. 

4. La chaîne terminale. Une nouvelle habileté émerge : compter n à 
partir de x dans les deux sens, ce qui implique l’énumération de la 
suite numérique en même temps que la conservation des nombres 
déjà émis. La difficulté croît avec le comptage à rebours et la taille de 
n, l’influence de ce dernier facteur disparaissant avec la scolarité. Au 
plus haut niveau d’élaboration, la chaîne devient bidirectionnelle, 
«emboîtée, sériée, cardinalisée et unitisée». 

On rejoint à la dernière étape la conception piagétienne du nombre, 
synthèse de la classe et de la série (1<(1+1)<(1+1+1)... etc.). Mais les rela¬ 
tions logiques sous-jacentes sont inférées des habiletés d’énumération et de 
comptage et non des performances réalisées à des épreuves où classification, 
sériation, et/ou conservation, sont explicitement impliquées. On peut certes 
penser que le comptage à rebours et le comptage de n à partir de x dans les 
deux sens sont les manifestations d’une certaine compréhension des proprié¬ 
tés de la séquence numérique. Mais la généralisation de ces conduites est re¬ 
lativement tardive, vers 9 ans selon Fuson et al. (1982, p.70). Des faits 
expérimentaux nombreux ont indiqué que la maîtrise opératoire de l’inclusion 
des classes et de la sériation (transitivité) ne survient qu’à partir de 10-11 ans 
(voir à ce sujet, pour une revue de question, Bideaud 1988; Bideaud et Houdé, 
1989; Leiser et Gillièron, 1990). S’agissant alors du nombre, deux éventualités 
se présentent. Ou l’enfant peut-être crédité dès 7-8-9 ans, de la compréhen- 
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sion des propriétés logiques de la chaîne numérique (chaîne bidirectionnelle, 
emboîtée, sériée) et alors il faut : 1) le prouver et 2) si c’est le cas, interpréter 
cette avance en termes de facilitation entraînée par le caractère d’emblée 
symbolique, abstrait du nombre. Ou bien l’enfant ne peut être crédité de cette 
maîtrise avant 10-11 ans (cas de l’inclusion et de la sériation) et on doit alors 
en tenir compte à la fois dans les évaluations et dans le choix des situations 
d’apprentissages. Dans ce deuxième cas, une autre interprétation pourrait 
être donnée : un niveau plus restreint de compréhension de la logique sous- 
jacente à la chaîne numérique pourrait s’avérer un pré-requis suffisant pour 
l’apprentissage des algorithmes de l’arithmétique élémentaire. Mais alors où 
se situerait la dernière étape et la maîtrise de la chaîne numérique ? Et pour 
quels progrès serait-elle nécessaire ? 

1.4 Que nous apportent les théories néo-structuralistes ? 

Le néo-structuralisme vise explicitement à articuler les apports du 
structuralisme genevois et du cognitivisme anglo-saxon dans le but de pallier 
les insuffisances du cadre explicatif piagétien. Il n’y a pas lieu ici de passer en 
revue ces théories et d’en faire le bilan (voir à ce sujet Ribeaupierre, 1983 ; Bi- 
deaud et Houdé, 1993 ; Bideaud, Houdé et Pédinielli, 1993). Ce sont des ex¬ 
plications très générales qui tentent de spécifier les étapes du développement 
tant au niveau du fonctionnement in situ qu’à celui des structurations cogni¬ 
tives sous-jacentes. Aucune d’elles ne prend pour cible la genèse du nombre 
et les acquisitions scolaires à l’exception toutefois de Case qui aborde, à la pé¬ 
riphérie de ce domaine, la lecture de l’heure et la valeur et l’usage de la mon¬ 
naie. On ne retiendra ici que certains concepts-clés, heuristiques, des 
perspectives de Pascual-Leone, de Case et de Fischer, susceptibles d’aider à 
la compréhension du fonctionnement et du développement de l’enfant dans 
les situations «mathématiques». 

1.4.1 Pascual-Leone : apprentissages 

et système modulaire de l'attention mentale 

Pascual-Leone reprend la distinction piagétienne entre apprentissage 
des contenus, c’est-à-dire des qualités des objets, (opérateur C) et apprentis¬ 
sage structural, c’est-à-dire des relations et des systèmes de relations, (opéra¬ 
teur L, logique). Mais à la différence de Piaget, pour toutes les acquisitions qui 
ne relèvent pas du seul conditionnement (opérateur C), l’opérateur 
«logique», L, n’entre jamais seul en action, mais sous deux formes : LC et LM. 
L’opérateur M renvoie à l’énergie mentale spécifiée par le maximum de schè¬ 
mes ou connaissances représentées que le sujet peut activer dans une opéra¬ 
tion mentale, maximum qui croît avec l’âge. L’apprentissage LC correspond à 
la fusion graduelle de schèmes - connaissances représentées de tous genres - 
par confrontation répétée du sujet avec les mêmes régularités. Il s’agit d’un 
apprentissage lent, cumulatif et tacite, qui génère des structures générale¬ 
ment automatisées et fortement intégrées dans leurs contextes d’origine. In- 
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versement, l’apprentissage LM, suscite, grâce au poids de M, une articulation 
rapide, associée à un effort cognitif, des schèmes (connaissances et opéra¬ 
tions) pertinents. Cette rapidité entraîne une autonomie des structures géné¬ 
rées qui sont alors applicables dans divers contextes. L’apprentissage LC 
génère le répertoire des connaissances « expérientielles » tandis que LM 
génère celui des connaissances rationnelles. 

Dans le cadre de sa théorie et en liaison avec d’autres opérateurs 
(I=inhibition ; F=facteur de champ qui filtre ou maximise les informations), 
Pascual-Leone distingue deux modes de fonctionnement possible, l’un auto¬ 
matisé, l’autre, attentionnel. Le mode attentionnel a été récemment précisé 
dans un système à quatre modules correspondant aux opérateurs M, I et F et 
aux schèmes exécutifs du sujet qui sont des programmes de calcul. En réfé¬ 
rence à ces modules et à leur interaction, Pascual-Leone décrit différentes 
stratégies attentionnelles correspondant à des problèmes spécifiques. A noter 
l’importance donnée à l’opérateur d’inhibition, I (inhibition des schèmes 
«dangereux» (par exemple, dans les épreuves de conservation) ou non perti¬ 
nents, ou moins pertinents). 

On peut appliquer cette conceptualisation à l’apprentissage de la chaî¬ 
ne numérique et à celui de la genèse des algorithmes (addition, soustraction). 
Selon J.P. Fischer (1993a, p.54) le comptage, entre 2-3 et 5-6 ans, est une con¬ 
naissance procédurale, résultat d’un apprentissage lent et graduel, 
«expérientiel», qui «nécessite une pratique considérable». De ce fait, il peut 
se révéler très contextualisé et donc plus difficilement «exportable» dans des 
situations variées. Mais alors quand et comment s’effectue l’apprentissage ra¬ 
tionnel qui doit conduire à l’assimilation des propriétés logiques de la série 
numérique ? On touche du doigt ici la nécessité d’une estimation de la qualité 
des acquisitions en maternelle et en première année primaire pour une 
meilleure compréhension des difficultés et des erreurs. La contextualisation 
trop poussée assortie d’un défaut de capacité d’inhibition est aussi, sans aucun 
doute, une cause d’erreurs. 

1.4.2 Case et les structures de contrôle 

Dans la perspective de Case, toute situation d’interaction entre le su¬ 
jet et l’environnement constitue un problème à résoudre. Le développement 
cognitif devient celui de Structures de Contrôle Exécutif (SCE) ou séquen¬ 
ces organisées de schèmes à trois composantes : la représentation du pro¬ 
blème dans lequel le sujet est impliqué, Y objectif doté le plus souvent d’une 
charge «affective» et les stratégies qui permettent de passer de la représen¬ 
tation à l’objectif. La genèse des SCE est jalonnée par une séquence de 4 sta- 
des (sensori-moteur, relationnel, dimensionnel et vectoriel) qui 
correspondent grosso modo aux stades piagétiens et qui se différencient par 
le type d’éléments mentaux que traitent les SCE (objets perçus et activités 
motrices, relations entre activités, dimensions du 1er ordre et dimensions du 
2ème ordre (rapports de dimensions). Chaque stade comporte trois sous-sta¬ 
des distingués par le nombre de cibles, de 2 à 4, impliqués dans la structure 
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de contrôle (objectifs). Cette augmentation est liée à celle de la capacité de 
mémoire à court terme, elle-même fonction de l’augmentation de l’efficience 
opératoire. L’efficience opératoire, par ailleurs, s’accroît au cours d’un stade 
sous l’action conjuguée de l’exercice et de la maturation. 

A ce modèle des structures de contrôle exécutif, Case a récemment 
ajouté la notion de Structure Conceptuelle Centrale (SCC). Il s’agit de ré¬ 
seaux de concepts interreliés, de nature logico-mathématique ou sociale, qui 
correspondent aux répertoires de connaissances transituationnelles. Ce sont 
eux qui donnent sens aux situations problèmes rencontrées. Une de ces SCC 
est relative au nombre. Ainsi à tout moment de son développement l’enfant 
dispose t-il de connaissances générales, plus ou moins élaborées et plus ou 
moins contextualisées, qui «dirigent» ses structures de résolution. L’élabora¬ 
tion de ces connaissances dépend évidemment du type d’apprentissage, au 
sens très général du terme, qui est à leur source. On retrouve ici la question 
posée par les opérateurs de Pascual-Leone. 

Le recours à la mémoire à court terme est intéressant. S’agissant de la 
séquence numérique, c’est sans aucun doute l’augmentation de cette capacité 
qui permet à l’enfant de 4 ans (dernier sous-stade du stade relationnel) de 
compter jusqu’à un nombre donné (conservation de ce nombre pendant le 
comptage). C’est elle aussi qui permet à l’enfant de 6-8 ans (1er et 2ème sous- 
stades du stade dimensionnel, qui implique la compéhension de relations en¬ 
tre éléments) de compter n à partir de x dans les deux sens. 

1.4.3 Kurt Fischer et l'enfant-en-contexte 

Le concept central de la théorie de K. Fischer est celui de structures 
de skills, ou structures d’habiletés de résolution de problème, qui se dévelop¬ 
pent, de la naissance à 30 ans, en quatre étages : réflexe, sensori-moteur, re¬ 
présentationnel et abstrait. A chaque étage, le sujet se développe selon quatre 
niveaux de complexité, qui correspondent, comme chez Case, aux types d’élé¬ 
ments mentaux traités par les structures de skills (unités sensori-motrices, 
appariement, systèmes, systèmes de systèmes). 

La spécificité de K. Fischer réside dans le fait que les étages, les ni¬ 
veaux et les processus de transition sont toujours ceux d’un sujet-en-contex- 
te et que les décalages des performances individuelles, suivant les supports 
contextuels, sont la règle du développement cognitif. D’où l’introduction, 
par K. Fischer, de la distinction entre niveau optimal et niveau fonctionnel 
suboptimal. Le niveau optimal correspond à la limite supérieure de complexi¬ 
té du répertoire des habiletés dans un domaine donné. Il est atteint dans une 
situation problème donnée, lorsque le support contextuel est un support à 
haut niveau de peyformance : support contextuel optimal. En revanche, 
lorsque le support est suboptimal le sujet fonctionne à un niveau inférieur, dit 
«fonctionnel». 

Il semble que cette distinction entre niveaux de fonctionnement puis¬ 
se être des plus intéressantes pour l’évaluation des capacités 
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«mathématiques» de l’enfant. En jouant sur le contexte - et c’est ce que fait 
Gelman avec son paradigme de la poupée qui compte - on peut évaluer à la fois 
le niveau «fonctionnel» et, en graduant les difficultés, le niveau optimal. Il faut 
souligner qu’avec Fischer, plus encore que chez les autres néo-structuralistes, 
le contexte des acquisitions joue plus qu’un rôle primordial : il n’y a pas de 
sujet sans contexte et les deux sont indissociables. 

Cet exposé, drastiquement raccourci de quelques concepts-clés des 
théoriciens néo-structuralistes, n’apporte pas des éléments directs à la re¬ 
cherche d’une évaluation diagnostique fine des capacités numériques de l’en¬ 
fant. Mais il montre une convergence sur certains points cruciaux dont 
l’évaluation doit tenir compte : type des apprentissages explicites et implici¬ 
tes, scolaires et extra-scolaires, rôle des contextes d’acquisition et d’évalua¬ 
tion, importance de l’attention et, partant, des capacités d’inhibition. 

2. L'ÉVALUATION DES CAPACITÉS 

«MATHÉMATIQUES» DES JEUNES ENFANTS : 
LES DONNÉES EMPIRIQUES 

Peu de chercheurs ont exploré systématiquement les capacités numé¬ 
riques des jeunes enfants. Trois études ont été ici retenues pour une analyse 
comparative. Deux d’entre elles, celle de Ginsburg et Russell (1981), et celle 
de Grégoire et Vanniewenhoven (1993), sont remarquables à plusieurs titres : 
la première pour l’empan des conduites observées, la seconde pour la préci¬ 
sion méthodologique, la finesse de l’analyse et l’importance de la population 
concernée. Le but de la troisième n’est pas, à proprement parler, un bilan des 
capacités. Mais dans la mesure où elle introduit des apprentissages, elle mon¬ 
tre ce que pourrait être une évaluation dynamique. 

2.1 La recherche de Ginsburg et Russell (1981) 

De nombreuses observations font ressortir un échec scolaire impor¬ 
tant, en mathématique, chez les enfants de milieux défavorisés. L’explication 
généralement avancée attribue cet échec à un déficit des stimulations de l’en¬ 
vironnement : celui-ci n’offrirait pas aux enfants les expériences nécessaires 
au développement des pré-requis sur lesquels se fonde l’apprentissage mathé¬ 
matique à l’école. Ginsburg et Russell explorent l’interaction possible entre le 
type de population (blanche et noire), la classe sociale (niveau bas et moyen), 
le statut familial (monoparental ou normal) et les connaissances mathémati¬ 
ques pré-scolaires. L’objectif est de vérifier - outre l’étude de ces interactions 
- si l’échec scolaire peut être prédit à partir de différences dans les connais¬ 
sances mathématiques précoces, pré-scolaires. 

L’étude principale porte sur 144 enfants dont la moitié fréquente des 
garderies (a.m. = 4;8) et l’autre moitié les jardins d’enfants (a.m. = 5;8). La moi¬ 
tié des enfants de chacune des populations appartient à un milieu très défavo- 



La mathématique 


risé et l’autre à un milieu moyen, l’indicateur choisi pour opérationnaliser la 
variable étant le Hollinsgshead Scale (index des positions sociales). A cha¬ 
cun de ces niveaux sociaux, la moitié des enfants appartient à la race noire et 
l’autre moitié à la race blanche. La variable «statut familial» est équilibrée 
dans chacun des sous-groupes. Au cours de trois séances, les enfants sont 
soumis individuellement à 17 tâches qui sont répertoriées dans la colonne de 
gauche du tableau 3. Ces tâches recouvrent le champ possible des connaissan¬ 
ces «logico-mathématiques» précoces. On peut les regrouper sous trois rubri¬ 
ques. 

I Évaluation des aspects non scolaires et non numériques de la pensée 

« mathématique ». 

1. Perception du «plus» : l’enfant doit indiquer parmi deux ensembles, à 
configuration variée, celui qui en a le plus. 

2. Sériation de 7 baguettes. 

3. Conservation numérique classique. 

4. Addition-ajout d’éléments et compréhension du résultat. 

5. Jugement d’équivalence de deux collections disposées différemment. 

II Évaluation au moyen de tâches non scolaires qui peuvent être résolus 

par des procédures de comptage. 

6. Comptage sans support (borne fixée à 50). 

7. Dénombrement de plusieurs collections différentes (6 collections de 3 à 
19 objets). 

8. Cardinalité (avec les collections précédentes). 

9. Indifférence de l’ordre (4 items). 

10. Principe d’abstraction : comptage d’une collection hétérogène. 

11. Détermination du plus grand de deux nombres donnés oralement. 

12. Règle de l’unité : l’ajout ou le retrait d’une unité à un ensemble d’objets 
accroît ou décroît d’une unité la séquence de comptage de cet ensemble. 

13. Application de la règle 12. 

14. Addition-calcul : résolution avec ou sans supports d’additions de chiffres 
qui vont de 2 à 7. 

III Évaluation de la représentation du nombre. 

15. Évaluation d’une représentation quelconque du nombre (traits, figures, 
écriture des chiffres). 

16. Lecture de nombres. 

17. Écriture de nombres. 

Ginsburg et Russell observent un effet massif de l’âge sur toutes les 
épreuves sauf pour l’épreuve «principe d’abstraction» réussie par les 144 en¬ 
fants (cf. tableau 3). A 4 ans, la variable statut social introduit une différence 
significative dans les épreuves de conservation, d’équivalence numérique de 
quantités égales diversement disposées et dans la comparaison de grandeur 
de deux nombres énoncés. Cet différence disparaît à 5 ans (effet de l’âge con- 
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jugué avec le programme du jardin d’enfant) pour les deux dernières épreu¬ 
ves. La variable population (noire vs blanche) exerce un effet sur la sériation 
et la règle de l’unité. 

Tableau 3 

Scores moyens observés en fonction de l'âge aux différentes épreuves de Ginsburg 
et Russell (1981) 



Scores 

maxi. 

4 ans 
(n=72) 

5 ans 
(n=72) 

1 

Perception du «plus» 

a 

6 

5,17 

5,69 



b 

6 

4,80 

5,15 



c 

6 

2,21 

2,50 

2 

Sériation 


6 

2,55 

4,32 

3 

Conservation 


6 

2.44 

3.57 

4 

Additions (ajouts) 


4 

2.68 

3.40 

5 

Equivalence 


12 

3.15 

4.28 

6 

Mots nombres 


50 

24.66 

36.94 

7 

Dénombrement 


6 

1.60 

2.27 

8 

Cardinalité 


6 

4.50 

5.70 

9 

Indifférence de l'ordre 


4 

2.32 

2.95 

10 

Principe d'abstraction 


1 

1 

1 

11 

Nombre plus grand 


10 

7.24 

8.89 

12 

Règle de l'unité 


12 

9.19 

11.40 

13 

Application de la règle 12 


8 

5.63 

7.58 

14 

Addition (calcul) 


6 

2.54 

3.91 

15 

Représentation du nombre 


3 

2.83 

2.36 

16 

Lecture des nombres 


4 

3.12 

3.72 

17 

Ecriture des nombres 


8 

2.33 

5.81 


Ces résultats sont intéressants à double titre. Tout d’abord ils permet¬ 
tent de dresser un inventaire à la fois large et précis des connaissances logico- 
mathématiques des jeunes enfants. Elles se révèlent consistantes et variées 
avec un effet puissant de l’âge. A 5 ans, la majorité des enfants réussissent la 
sériation des baguettes, connaissent et appliquent la règle de l’unité, connais¬ 
sent la règle du dernier mot-nombre (objets en ordre). Les moyennes élevées 
en témoignent. Et si l’effet de l’âge est puissant, l’observation du tableau 3 té¬ 
moignent de connaissances certaines. Selon Ginsburg et RusseE, la connais- 
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sance mathématique «extra-scolaire» se développerait de manière précoce et 
robuste. En second lieu, ces résultats démontrent que, mises à part la conser¬ 
vation et l’équivalence, les enfants arrivent à l’école primaire, quel que soit 
leur statut social, avec des connaissances déjà nombreuses et importantes. 
Mais alors pourquoi les enfants des milieux défavorisés, et dans ces milieux 
plus particulièrement les enfants noirs, échouent-ils aussi massivement lors¬ 
qu’il s’agit des mathématiques scolaires ? Les expectatives ne sont pas en cau¬ 
se. Selon Ginsburg et Russell, aux âges observés et même à la fin de la 
première année scolaire, les enfants pauvres noirs et blancs s’attendent à 
réussir en mathématique au long de leur cursus. Les auteurs invoquent alors 
la disparition de cette motivation en raison de difficultés liées au statut social 
et l’inadéquation de l’enseignement scolaire. 

C’est ce facteur que nous retenons ici et pour deux raisons. La premiè¬ 
re raison tient au caractère intrinsèque de l’enseignement mathématique qui 
ne prend pas très souvent en compte les significations que le jeune enfant at¬ 
tache au nombre avant et hors de l’école (voir Sophian, 1991). La seconde 
tient à la fois à certaines caractéristiques des milieux sociaux et à l’enseigne¬ 
ment scolaire. Dans les milieux défavorisés l’enfant est confronté très tôt à des 
problèmes pratiques de calcul. Il intègre de ce fait davantage de schémas et 
des routines rigides qui peuvent freiner des apprentissages scolaires plus abs¬ 
traits. Les résultats de Ginsburg et Russell nous donnent les performances 
moyennes : les procédures sous-jacentes ne sont pas explicitées. Il se dégage 
donc encore ici à la fois la nécessité d’une évaluation plus fidèle susceptible 
d’orienter des apprentissages adaptés et le rôle des contextes plus ou moins 
favorables d’acquisition du point de vue de leur rigidité ou de leur généralisa¬ 
tion possible. 


2.2 La recherche de Grégoire et Van Nieuwenhoven (1993) 

Les auteurs se proposent d’évaluer les capacités de comptage en troi¬ 
sième maternelle et en première primaire. Pour ce faire, ils construisent des 
épreuves susceptibles d’appréhender le plus précisément possible un fonc¬ 
tionnement correspondant aux principes de Gelman. La population de l’expé¬ 
rience comprend 439 enfants de 5 ans (troisième année maternelle) et 103 
enfants de 6 ans (première primaire). 

Le matériel est constitué de deux ensembles de bouchons : l’un de 12 
bouchons de plastique transparent ; l’autre de 6 bouchons de plastique bleu. 
Pour les trois premiers principes de Gelman (ordre stable, correspondance 
mot-nombre et dernier mot-nombre : cardinalité de Gelman), deux épreuves 
sont construites : production et détection. Pour les deux autres principes 
(abstraction et indifférence de l’ordre), une seule épreuve : la production. 
L’ensemble de ces épreuves est décrit ci-dessous. 
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1. Ordre stable 

1.1. Production 

- compter le plus loin. 

- compter jusqu’à 9. 

- compter à partir de 3. 

- compter de 5 à 9. 

- compter à rebours à partir de 7. 

1.2. Détection 

L’expérimentateur compte en commettant des erreurs et des pseudo-er¬ 
reurs (4) types d’erreur). 

2. Principe de correspondance 

2.1. Production : 2 items 

- l’enfant doit compter les 12 bouchons d’abord alignés, puis dispersés. 

- même tâche avec changement de la disposition. 

2.2 Détection : 2 items 

- comptage opéré par l’expérimentateur en violant le principe de corres¬ 
pondance terme à terme. 

- variation sur la situation précédente. 

3. Dernier mot-nombre (cardinalité) 

3.1. Production 

Après avoir compté les bouchons alignés, l’enfant doit répondre à la 
question : combien y en a t-il en tout ? 

3.2 Détection 

L’expérimentateur compte une fois correctement puis en faisant une er¬ 
reur de double comptage. L’enfant doit répondre à la même question que 
plus haut. 

4. Principe d’abstraction 

L’enfant doit compter les éléments hétérogènes (forme, taille, couleur) 
d’un ensemble d’objets. 

5. Non pertinence de l’ordre 

Tâche A. L’enfant compte 12 bouchons alignés. Après son comptage, 
on lui demande s’il obtiendrait le même nombre (donné par 
l’enfant) s’il commençait son comptage par l’autre extré¬ 
mité. 

Tâche B. Même procédure avec les bouchons dispersés. 

Les pourcentages de réussite (effectif) sont donnés dans le tableau 4 
pour toutes ces épreuves. 
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Tableau 4 

Performances (%) observées aux épreuves de Grégoire et Van Nieuwenhoven (1993) 


Epreuves 

5 ans 

6 ans 

1. Ordre stable 

1.1. Production 



compter le plus loin 

25 

43 a 

jusqu'à 9 

83 

98 

à partir de 3 

48 

57 

de 5 à 9 

46 

70 

à rebours depuis 7 

27 

75 

1.2. Détection erreurs 

comptage aléatoire 

92 

92 

inversion 

88 

95 

omission 

87 

88 

répétition 

92 

94 

2. Principe de correspondance 



2.1. P. bouchons alignés 

79 

93 

dispersés 

66 

83 

2.2. D. bouchons compté 2 fois 

77 

85 

sauté 

81 

84 

3. Dernier mot-nombre 



3.1. P. bouchons alignés 

64 

90 

dispersés 

62 

89 

3.2. D. compt. exp. correct 

73 

86 

incorrect 

70 

82 

4. Principe d'abstraction 

réussite 

réussite 

5. Principe d'indifférence de l'ordre 
bouchons alignés 



dispersés 

67 

85 


65 

87 


a. La première ligne indique le résultat moyen au comptage. Pour toutes les autres lignes, il 
s'agit de l'effectif en %. 


La comparaison avec les résultats de Ginsburg et Russell concernant 
les épreuves communes est intéressante bien que mal aisée, l’une donnant des 
moyennes de performance et l’autre des pourcentages de réussite. Néanmoins 
quelques points ressortent (on rappelle que l’expérience de Ginsburg et Rus¬ 
sell porte sur des enfants de 4 et 5 ans, celle de Grégoire et Van Nieuwenhoven 
sur des enfants de 5 et 6 ans) : 

1. Le comptage d’éléments hétérogènes (principe d’abstraction) est 
massivement réussi à 4, 5 et 6 ans. 

2. L’épreuve du dernier mot-nombre (cardinalité) est bien réussie à 5 
ans dans les deux recherches quand il s’agit de la production (pas de 
détection dans Ginsburg et Russell). 
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3. L’épreuve «indifférence de l’ordre» paraît atteindre dans les deux 
cas, à 5 ans, le même niveau de réussite. 

4. L’effet de l’âge se fait sentir aussi bien entre 4 et 5 ans qu’entre 5 et 6 
ans : il existe bien un développement du respect des principes entre 
4 et 6 ans. 

La différence des objectifs des deux recherches oriente différemment 
les conclusions des auteurs. Ginsburg et Russell soulignent l’importance et la 
variété de compétences précoces. Grégoire et Van Nieuwenhoven sont plus 
sensibles aux erreurs des enfants de 5 et 6 ans et il faut dire que leurs épreu¬ 
ves de comptage sont bien plus précises et complètes que celles de Ginsburg 
et Russell. Leur contexte sollicite vraisemblablement le niveau optimal défi¬ 
ni par K. Fischer tandis que Ginsburg et Russell, avec leur situation compara¬ 
ble, solliciteraient un niveau fonctionnel. 

Il semble que l’on puisse conclure à l’existence d’un certain niveau de 
compétence assez bien établi dès 4 ans avec, dans le cas des deux recherches, 
une notable variation inter-individuelle. Dans les deux cas on doit toutefois 
souligner qu’il s’agit, dans la plupart des épreuves (comptage) d’une évalua¬ 
tion de surface (cf. Jonnaert, 1993), au sens où, à performance égale, rien ne 
permet de différencier un enfant de 4 ans ou de 5 ans d’un enfant de 6 ans du 
point de vue des compétences réelles. Or, outre les différences inter-indivi¬ 
duelles de performance, il existe des différences à ce niveau. Il semble qu’une 
étude longitudinale telle que Grégoire et Van Nieuwenhoven la préconisent 
avec raison pourrait intégrer, outre leurs épreuves si précises, une évaluation 
de la «logique» sous-jacente : épreuves d’inclusion et de sériation, appliquées 
à des objets mais aussi à la séquence numérique. 

2.3 L'expérience de Cléments (1984) 

Il s’agit là d’une expérience d’apprentissage. Je l’expose ici pour la rai¬ 
son qu’il m’a toujours semblé que l’entraînement à une certaine notion par tel¬ 
le ou telle méthode peut renseigner sur les processus actuels d’acquisition qui 
ne sauraient être étrangers aux organisations actuelles de l’enfant. Les effets 
d’un entraînement spécifique peuvent être considérés, pour le moins, comme 
des indicateurs du développement actuel de la notion, plus sensibles que les 
réponses aux seules épreuves d’évaluation. 

Cléments (1984) compare, sur des enfants âgés de 4 ans (m.a.=4;6 
ans), les effets respectifs d’un entraînement aux activités numériques (N) et 
d’un entraînement aux opérations logiques (L) (3 séances par semaines de 20 
mn. chacune pendant 8 semaines : soit 24 séances pour l’un et l’autre). L’en¬ 
traînement N porte sur des activités numériques diverses : stratégies de 
comptage, recherche d’un ensemble de numérosité donnée parmi sept ensem¬ 
bles de numérosités variables, production d’un ensemble de numérosité don¬ 
née parmi 20 objets, etc. L’entraînement L est basé sur des exercices de 
classification et de sériation simples et multiples. Le pré et le post-test com- 
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portent 10 épreuves numériques, dont la conservation classique (score total 
possible : 59 points) et 11 épreuves logiques (score total : 50 points). La com¬ 
paraison des gains observés entre pré et post-test dans les deux groupes ex¬ 
périmentaux et dans un groupe contrôle, C, indique : 1) Dans les deux 
domaines, numérique et logique, les deux groupes N et L réalisent des gains 
significatifs ; 2) Les enfants N réalisent des gains plus importants lorsqu’il 
s’agit des concepts numériques : 27,67 points gagnés contre 11,06 pour les en¬ 
fants L (différence moyenne entre pré et post-test). Ces mêmes enfants font 
également des progrès dans le domaine logique du même ordre que ceux des 
enfants L (respectivement 19,93 et 19,94) ; 3) Le transfert «nombre-logique» 
est de loin plus important que le transfert «logique-nombre», bien que celui- 
ci soit certain ; 4) Concernant l’épreuve classique de conservation de l’équiva¬ 
lence (items de 7 et 9 éléments, score maximal = 4), absente des deux entraî¬ 
nements, le groupe N passe, entre pré et post-test, de 1,40 à 3,80 (score 
moyen), les enfants de L, de 0,87 à 1,73 et ceux de C restent à 1,30. Concer¬ 
nant le comptage de différents ensembles en ordre et en désordre de 6 à 12 
éléments, les moyennes passent de 5,27 à 8,73 en N, de 5,13 à 7,07 en L (score 
maximal 9). Dans l’épreuve où les enfants devaient donner le nombre correct 
d’éléments d’un ensemble de 7 ou 8 objets, dont on croissait ou décroissait de 
1 ou 2 le nombre, les moyennes passent de 1,33 à 5,87 dans le groupe N, de 
1,40 à 3,40 en L et de 1,73 à 2,40 en C. On rappelle qu’il s’agit d’enfants de 4 
ans. 


Au vu des résultats, Cléments écrit : «Le transfert démontré pour cha¬ 
cun des entraînements revêt une signification psychologique et pédagogique. 
Si, à l’évidence, les classes, les sériations et le nombre sont interdépendants, 
l’apprentissage numérique reste cependant prioritaire» (ibid., p.774). Ces ré¬ 
sultats et interprétations ne discréditent pas la théorie piagétienne mais ac¬ 
cordent aux activités numériques un rôle déterminant (position de Fuson, 
1991). Ils soulignent aussi l’intérêt d’une évaluation dynamique qui rédui¬ 
rait l’écart entre le niveau actuel et le niveau potentiel de l’enfant, ou, selon K. 
Fischer, entre un niveau fonctionnel et un niveau optimal. 


3. CONTEXTES D'UTILISATION, 

D'ÉVALUATION ET D'APPRENTISSAGE 


Sans aucun doute l’enfant qui entre à l’école primaire possède déjà des 
connaissances numériques considérables. L’exposé précédent en témoigne 
(pour un relevé plus exhaustif de ces savoirs et savoir-faire, on peut se repor¬ 
ter à Young-Loveridge, 1987). Quelle que soit la perspective sous-jacente et 
quelles que soient les interprétations suscitées, la construction du nombre se 
révèle progressive et complexe. De nombreux processus y concourent qui 
touchent à la quantification, aux capacités de mise en relation (correspondan¬ 
ce, ordre, emboîtement), à la mémoire à court et à long terme, et même aux 
métaconnaissances. Concernant ce dernier point on sait, par exemple, qu’une 



Niveaux préalables et apprentissages numériques élémentaires 


réflexion suscitée sur l’exactitude de leurs réponses conduit des enfants de 4 
ans à rechercher un indice fiable de jugement de conservation - en l’occurren¬ 
ce, la numérosité (Michie, 1984). De nombreux facteurs interviennent aussi. 
Les facteurs linguistiques jouent au niveau de la chaîne numérique verbale 
dont ils conditionnent en partie l’intégration progressive. La figure 1 tend à 
donner une représentation à l’évidence approximative et partielle des domai¬ 
nes concernés par la construction du nombre. Y sont ajoutés, en toile de fond, 
les contextes pragmatiques (utilisation du nombre dans la vie quotidienne) et 
normatifs (utilisation plus abstraite du nombre dans l’apprentissage scolaire) 
d’utilisation et donc d’acquisition et d’évaluation. 


Contexte extra-scolaire 



Figure 1 

Les domaines concernés par la construction du nombre (d'après Bideaud et Vilette, 
1995). 


Les nombres sont des outils culturels à usages divers intégrés dans 
des contextes très différents. S’agissant de quantités discontinues, ils indi¬ 
quent soit la totalité d’un ensemble («Pierre a trois frères et deux soeurs»), 
soit le rang d’un élément dans une suite («Pierre est le troisième enfant de la 
famille»). Si la dénotation verbale permet en général de distinguer précisé¬ 
ment la cardinalité de l’ordinalité («quatre» et «quatrième» par exemple), de 
nombreux cas d’utilisation du nombre sont ambigus à cet égard. Dans 
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l’assertion : «J’habite au 4 de la rue Vauban», le chiffre 4 ne renvoie pas à la 
cardinalité ; il indique un lieu (la maison de la rue Vauban qui a le numéro 4) 
et un ordre (la maison qui, dans la rue, est située avant celle qui porte le n°6 
et après celle qui porte le n°2). S’agissant de la quantité continue, le nombre 
devient une «mesure » en indiquant les unités qui correspondent à la quantité 
en cause : «Je voudrais 3 mètres de ce tissu» ou «Pesez 250 grammes de 
farine». Hors de toute fonction cardinale, ordinale ou de mesure, le nombre 
peut aussi être utilisé comme un index discriminatif : c’est le cas des numéros 
de carte de sécurité sociale, de téléphone, etc. C’est aussi l’un des sens du «4» 
de la rue Vauban cité plus haut. 

Ces quelques exemples montrent à la fois la diversité et la généralité 
de l’emploi du nombre. Nous vivons dans un monde chiffré et les enfants, in¬ 
terrogés dans nos recherches lors d’exercices de laboratoire, baignent dans 
ces chiffres, leur donnent des significations, se les approprient pour les utiliser 
à leur manière. Dans une recherche en cours (Bideaud et Daïf, à paraître), 
l’évolution des significations des nombres impliqués dans la vie quotidienne 
est étudiée chez des enfants de 3 à 8 ans. Des enfants de 5 ans à qui l’on de¬ 
mande la signification du numéro accolé au nom de leur rue donnent des ré¬ 
ponses très diverses : « c’est le numéro qui est sur la porte » ; « c’est le numéro 
pour dire au facteur de mettre les lettres » ; «il y a un 7 pour dire que la maison 
est après le 5». Certains enfants essaient déjà d’expliquer, plus ou moins con¬ 
fusément, l’opposition des numéros, pairs et impairs, de chaque côté de la rue. 
Les différences sont vraisemblablement extrêmement dépendantes du con¬ 
texte familial et de la pédagogie parentale d’explication et d’utilisation du 
nombre. Il n’existe, à notre connaissance, aucune étude systématique des pra¬ 
tiques éducatives familiales dans ce domaine et des différences qu’elles pro¬ 
voquent. Rieunaud (1989, p.57) écrit qu’au cours de ses recherches sur la 
comptine, il a été surpris d’entendre de nombreux enfants lui dire qu’ils 
avaient appris à compter «dans la voiture de leurs parents, en comptant les 
voitures qui passaient». Or, selon Rieunaud, il s’agirait là d’une situation d’ap¬ 
prentissage particulièrement favorable. «L’enfant, en voiture, est un enfant 
éducable, car il est en situation de curiosité disponible ; éducable d’autant plus 
que c’est dans un tourbillon d’images qui le fouette et le ravit, qu’on propose 
un aliment à son attention : repérer des automobiles!» (ibid., p.57). 

L’utilisation du comptage, quel que soit son degré d’élaboration, se gé¬ 
néralise très vite à des situations de la vie quotidienne bien différentes de cel¬ 
les que l’enfant rencontrera à l’école ou qu’il rencontre s’il fréquente déjà 
l’école primaire. Dans la vie quotidienne, il s’agit d’un contexte pragmatique 
qui suscite, dans l’interaction sociale, des procédures finalisées. Les enfants 
utilisent le nombre très tôt dans des séquences d’interactions sociales prati¬ 
ques - notamment dans leur rapport avec l’argent : argent de la tirelire compté 
en vue d’un achat, rémunération de petits services, argent confié pour les 
courses, etc. L’enfant peut disposer de routines de calcul difficilement exploi¬ 
tables dans un autre contexte. C’est la raison possible des difficultés et des dif¬ 
férences observées lors de situations plus abstraites. Une observation de 
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Carraher et al. (1985) est très instructive à cet égard. Les auteurs citent le cas 
d’enfants de Récife, vendeurs ambulants de noix de coco. Soucieux de ne pas 
se tromper dans leur calcul, ce qui entraînerait la perte de leur clientèle, ces 
enfants se méfient des «trucs» enseignés à l’école. C’est ainsi que la règle ap¬ 
prise selon laquelle pour multiplier un nombre par 10, il faut lui ajouter un zé¬ 
ro, ne leur paraît pas du tout sûre, faute d’une compréhension exacte de ce 
qu’elle recouvre. Ils opèrent autrement. C’est la cas, par exemple, d’un enfant 
qui calcule le pris de 10 noix de coco, à 35 centavos pièce, de la manière 
suivante : (105+105+105)+35. Il a vendu souvent 3 noix, et il sait à coup sûr 
que 35x3=105. Il sait aussi sûrement que 10=3+3+3+1. D’où le calcul effectué, 
gage de sécurité. Cet exemple tendrait à montrer qu’une interrogation portant 
sur les compétences sociales pratiques, quotidiennes, du jeune enfant peut 
fournir des indices précieux quant à ses capacités réelles et quant aux proces¬ 
sus de résolution qu’il engage. 

4. CONCLUSION 

La construction du nombre est complexe. Son évaluation diagnostique 
l’est tout autant. Dans cet exposé, j’ai voulu soulever des questions trop sou¬ 
vent éludées et suggérer des pistes pour une évaluation diagnostique la plus 
exhaustive possible des capacités «mathématiques» des jeunes enfants, 
compte tenu de certains apports de la psychologie cognitive. 

Quatre points, me semble t-il, devraient plus particulièrement retenir 
l’attention : l’estimation des compétences sous-jacentes aux procédures ob¬ 
servées, l’effet des contextes sur la nature des acquisitions, l’importance des 
capacités générales de résolution de problème et, enfin, la nécessité d’une 
évaluation dynamique et non seulement statique. 

4.1 Structures et procédures 

On donne ici au terme «structure» le sens très général d’organisation 
cognitive sous-jacente, sans statuer sur la nature des liaisons impliquées. Un 
des apports de là psychologie cognitive constructiviste est d’avoir montré que 
des procédures de réussite ou d’échec identiques peuvent renvoyer à des or¬ 
ganisations très différentes de connaissances spécifiques et/ou plus générales 
(voir, par exemple, Bideaud et Houdé (1989) pour la catégorisation). C’est 
l’évidence pour la cardinalité dont le statut développemental est bien différent 
suivant qu’elle est associée ou non à la conservation des éléments discrets en 
cause. Peut-on concevoir qu’une cardinalité précoce qui s’accommode d’une 
variation de la quantité en fonction de transformations perceptives apparen¬ 
tes puisse avoir la même signification que celle qui maintient l’invariance dans 
les mêmes conditions ? 

Il semble bien que les apports théoriques et méthodologiques des 
deux approches, structurale et fonctionnelle, doivent être pris en compte 
complémentairement. Dans la pratique, cette utilisation «synthétique» s’avè- 



La mathématique 


re plutôt difficile. Elle réclame un véritable effort de recherche méthodologi¬ 
que. Mais le jeu en vaut la chandelle et cela ressort avec force du chapitre que 
Grégoire consacre, dans ce volume, à l’évaluation diagnostique des troubles 
d’apprentissage en mathématiques. 

4.2 Contextes et apprentissages mathématiques 

On tend à oublier que l’enfant, tout comme l’adulte d’ailleurs, est tou¬ 
jours un sujet-en-contexte. L’enseignement mathématique à l’école primaire 
ignore le plus souvent les connaissances antérieures de l’enfant, acquises tout 
autant à l’école maternelle qu’au sein de l’environnement familier. Le cher¬ 
cheur les ignore aussi qui ne manipule que les aspects extérieurement obser¬ 
vables de la performance des sujets. C’est le cas de Siegler et du modèle - très 
intéressant par ailleurs - qu’il propose pour expliquer les différences intra et 
inter-individuelles dans la résolution de problèmes d’arithmétique élémentai¬ 
re (voir Siegler, 1988 pour l’une des principales publication à ce sujet ; voir 
aussi Reuchlin, 1991, et Lemaire, 1993, pour une analyse précise du modèle). 
La répartition a posteriori effectuée par Siegler entre bons et mauvais élèves, 
au vu des performances, n’est pas satisfaisante. A ce sujet, Reuchlin écrit 
(1991, p.209) : «Une utilisation différentielle plus fondamentale consisterait à 
émettre des prévisions individuelles sur la stratégie employée... et sur les dif¬ 
férents aspects des performances réalisées, en assignant, pour chaque indivi¬ 
du, une valeur à certaines variables figurant dans le modèle ». Reuchlin évoque 
alors, parmi les variables possibles, les apprentissages spécifiques préalables. 
On peut aussi invoquer, outre ces apprentissages, un champ plus large qui en¬ 
globe les connaissances numériques générales tout autant que les apprentis¬ 
sages spécifiques, en distinguant les apprentissages scolaires normatifs des 
apprentissages pragmatiques extra-scolaires. Dans cette visée, l’inventaire 
des acquis procéduraux extra-scolaires pourrait s’avérer précieux. Et cela 
vaut pour les apprentissages scolaires. S’agissant de la multiplication, par 
exemple, Brissiaud (à paraître), souligne les différences qui peuvent survenir 
dans sa résolution (mobilité et efficacité) selon qu’a été utilisée, pour l’ap¬ 
prentissage, la table des additions réitérées (1 fois 3, 2 fois 3,...) ou la table 
classique (3 fois 1, 3 fois 2,...). Il montre aussi que c’est seulement dans une 
culture de l’écrit que la multiplication peut devenir autre chose qu’une simple 
addition répétée. On peut alors penser que le poids différent donné à l’oral et 
à l’écrit puisse introduire, selon les contextes scolaires d’apprentissage, des 
différences inter-individuelles dans l’organisation des connaissances déclara¬ 
tives et dans les procédures de traitement, qu’il s’agisse de la multiplication ou 
de l’addition. 

4.3 Les capacités générales de résolution de problème 

En dehors des connaissances spécifiques nécessaires, toute situation- 
problème exige, pour sa résolution, la mise en oeuvre d’habiletés plus généra¬ 
les dont le défaut entraîne des échecs répétés. Les perspectives cognitivistes 
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et néo-structuralistes mettent l’accent sur l’empan de la mémoire de travail et 
sur les processus d’attention et de contrôle. Gelman et Meck (1991, p.220) 
sont également sensibles à ces aspects du développement. Elles écrivent en 
effet que, malgré l’existence de compétences mathématiques bien définies, 
deux sources d’erreurs sont possibles : une compétence procédurale inadé¬ 
quate au niveau de l’établissement des plans d’actions et une compétence in¬ 
terprétative limitée. Ces deux types de compétence sont à l’évidence 
impliquées dans le système modulaire de l’attention mentale de Pascual-Leo- 
ne (cf. paragraphe 1.4.1.) où l’accent est mis sur les capacités conjointes d’ac¬ 
tivation des schèmes pertinents et d’inhibition de ceux qui sont «dangereux» 
ou pour le moins inadaptés. Ces compétences sont aussi impliquées dans les 
structures de contrôle exécutifs de Case (cf. 1.4.2.) qui régissent, compte 
tenu des connaissances intégrées en mémoire à long terme, les liaisons entre 
représentation du problème, objectif et stratégies de résolution - ces liaisons, 
à une étape donnée du développement, étant étroitement tributaires de la ca¬ 
pacité de la mémoire de travail. 

Outre l’évaluation des connaissances mathématiques, il semble bien 
que celle des capacités de mémorisation, d’attention et de contrôle soit néces¬ 
saire pour un examen approfondi des difficultés rencontrées par certains en¬ 
fants. 

4.4 Vers une évaluation diagnostique plus dynamique 

L’expérience de Cléments (1984), relatée au paragraphe 2.3., montre 
comment un apprentissage pas à pas permet à l’enfant «d’exprimer» ses ca¬ 
pacités réelles. On a vu que K. Fischer (cf. 1.4.3.) appelle niveau optimal de 
développement la limite supérieure de complexité du répertoire des habiletés 
de l’enfant à une étape donnée. Ce niveau n’est exploité que lorsque le support 
contextuel est optimal. Les épreuves proposées au cours d’une évaluation 
classique sollicitent-elles ce niveau ? Une estimation qui impliquerait une col¬ 
laboration constructive entre l’adulte-observateur et l’enfant ne rendrait-elle 
pas compte d’un état des lieux plus exact ? 

La notion de zone proximale de développement de Vygotsky (1984, 
p.272-273) est intéressante à cet égard. Elle rend compte des rapports entre 
apprentissage et développement au cours de l’histoire sociale de l’enfant. Ce¬ 
lui-ci peut, à tout moment, être caractérisé sous deux aspects : 1/ son niveau 
actuel, fonctionnel, tel qu’il peut être évalué à l’aide d’épreuves standardisées 
ou non ; 2/ son niveau de développement potentiel correspond à ce qu’il est 
capable défaire avec un adulte à un certain moment et sera capable de 
réaliser seul ensuite. Cette potentialité, plus ou moins actualisable selon l’in¬ 
teraction, que Vygotsky nomme zone proximale de développement corres¬ 
pond au niveau optimal de K. Fischer. A noter que K. Fischer invoque un 
contexte optimal d’actualisation et non une intervention de l’adulte. 

On peut se demander si une interaction préparée et programmée ne 
permettrait pas, au cours de l’examen, l’estimation plus exacte des connais- 
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sances déclaratives et procédurales et des points d’achoppement. Elle serait 
à conduire au sein ou en complément d’une évaluation diagnostique classique. 
Il me semble aussi que le contenu, lorsqu’il est déterminé dans un domaine 
précis, des concepts de zone proximale, niveau optimal et niveau fonctionnel, 
serre de plus près la réalité du développement que l’opposition très générale 
compétence/performance. 
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Introduction 

Il est devenu banal de souligner l’interdépendance entre l’évaluation 
et l’enseignement; l’évaluation joue un rôle considérable dans le processus 
éducatif, que ce soit directement pour l’orientation et la sélection des élèves, 
ou indirectement par les messages implicites que véhicule le choix de tels ou 
tels contenus lors des examens, pour ne citer qu’un exemple parmi beaucoup 
d’autres. S’interroger sur l’évaluation diagnostique des apprentissages, c’est 
déjà faire un pas de plus et privilégier une approche centrée sur l’individu en 
tant qu’apprenant et se fixer comme objectif de mettre en évidence les acqui¬ 
sitions résultant du processus d’apprentissage. Si les travaux psychologiques 
classiques n’ont guère permis de traiter de manière satisfaisante ce type de 
question, les développements qu’a connus la psychologie cognitive depuis 
près de trente ans semblaient davantage porteurs de promesses quant à la 
mise à disposition des praticiens de l’éducation d’outils susceptibles de guider 
leur action. Dans les quelques pages qui suivent nous tenterons de faire un bi¬ 
lan des contributions de la psychologie cognitive à ce domaine particulier 
d’application. 

A propos des changements intervenus dans différents domaines des 
sciences humaines au cours des 40 dernières années, il est devenu courant de 
parler de «révolution» cognitive (Gardner, 1985). Nous manquons de recul 
pour en apprécier pleinement l’ampleur et juger si Varela a raison en pensant 
qu’il s’agit de «laplus importante révolution conceptuelle et technologique 
depuis l’avènement de la physique atomique, ayant un impact à long ter¬ 
me à tous les niveaux de la société» (Varela, 1989, p. 21). 

Lorsqu’on s’interroge sur les apports de la psychologie cognitive, il 
convient en premier lieu de préciser de quelle psychologie cognitive il est 
question. En effet, au sens large la psychologie cognitive englobe un ensemble 
très vaste de domaines et de travaux dont il est bien difficile d’apprécier en 
général les apports et les limites, vu la diversité qui les caractérise. Nous adop¬ 
tons plutôt une terminologie consistant à distinguer, à la suite de Wagner et 
Sternberg (1984), trois conceptions de l’intelligence ayant des implications 
pour l’enseignement : la perspective psychométrique, la perspective piagé- 
tienne et la perspective cognitiviste au sens strict souvent désignée par l’ex¬ 
pression «traitement de l’information». Cette dernière approche est, depuis 
les années 60, l’une des tendances dominantes en psychologie, ayant supplan¬ 
té l’approche comportementaliste. Cet «impérialisme» a même touché des do¬ 
maines aussi divers que les pratiques thérapeutiques (Beck, 1976; Ellis, 1962) 
ou l’explication des troubles du langage (Ellis, 1989). On peut mentionner que 
cette domination d’une approche cognitiviste n’est pas spécifique à la psycho¬ 
logie, mais qu’on l’observe également dans plusieurs autres disciplines. 

Pour être complet, on se doit de mentionner le fait que l’apogée du 
courant cognitiviste semble dépassée au début des années 90 et que des criti¬ 
ques se sont élevées contre différents aspects de cette approche, de nouvelles 
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tentatives étant entreprises dans différentes directions pour dépasser les dif¬ 
ficultés auxquelles elle se heurte. 

Il sera question ici plus spécifiquement des apports de la psychologie 
cognitive au sens strict du courant «traitement de l’information» dans un do¬ 
maine particulier, à savoir l’analyse des procédures des élèves. Cette discus¬ 
sion semble d’autant plus légitime que ce courant est marqué par un souci 
d’application plus marqué que dans le cadre des approches qui peuvent lui 
être comparées. 


1. SPÉCIFICITÉS ET APPORTS 
DE L'APPROCHE COGNITIVE 


L’un des représentants les plus typiques du courant cognitiviste, John 
Anderson (1980,1983) a souligné la nécessité d’une analyse abstraite, seule à 
même de rendre compte des conduites d’un sujet au niveau qui nous intéres¬ 
se. Pour expliquer les conduites cognitives on pourrait se tourner vers les mé¬ 
canismes physiologiques sous-jacents. Non seulement on se heurterait à des 
difficultés techniques sérieuses, mais il s’agirait aussi d’un niveau d’analyse 
trop détaillé pour être utile. Un programmeur qui donne trop de détails sur le 
déroulement de son programme ne nous apprend pas l’essentiel; ü convient 
plutôt de rester à un niveau suffisant d’abstraction. Les psychologues cogniti¬ 
vistes sont donc à la recherche du bon ensemble de concepts susceptibles de 
décrire et d’expliquer l’intelligence humaine. La physiologie peut poser des 
contraintes que devront satisfaire les théories mais non déterminer les théo¬ 
ries elles-mêmes (p. ex. la quantité d’information que le cerveau peut contenir 
est susceptible d’exclure certaines théories, mais non de suggérer la bonne 
théorie). 

La tâche des psychologues cognitifs est de nature inférentielle. A par¬ 
tir de l’observation des conduites, il s’agit de décrire les mécanismes sous- 
jacents. En psychologie cognitive, une théorie est un système conçu pour ré¬ 
sumer et systématiser divers faits connus et faire des prédictions au sujet de 
phénomènes à découvrir. Une théorie est basée sur les faits connus, mais plu¬ 
sieurs théories peuvent rendre compte des faits. Cela est particulièrement vrai 
en psychologie cognitive. Le psychologue propose des théories sur ce qui se 
passe dans la tête du sujet, sur la base du comportement externe. Il n’y a 
aucun moyen de savoir si une théorie cognitive décrit vraiment ce qui se passe 
à l’intérieur. 

Toujours selon Anderson, une théorie cognitive diffère donc de la vé¬ 
rité de deux manières : (1). Même en cas de prédiction correcte, il n’y a pas 
de certitude de l’adéquation de la théorie avec la réalité des processus inter¬ 
nes. Beaucoup de mécanismes différents peuvent en effet produire le même 
comportement extérieur (ceci peut être démontré dans le cadre de la théorie 
des automates). (2). Même si une théorie rend bien compte des données, il 
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existe toujours une chance qu’elle n’arrivera pas à prédire correctement le ré¬ 
sultat d’une nouvelle expérience et devra donc être révisée. 

L’approche cognitive a eu un impact très important dans pratique¬ 
ment tous les domaines de la psychologie. Il est sans doute trop tôt pour faire 
un bilan définitif des apports de cette nouvelle perspective d’autant plus que 
son développement est loin d’être achevé. On peut néanmoins se risquer à 
évoquer quelques éléments qui semblent incontestables, d’une part en ce qui 
concerne les méthodes et d’autre part au sujet de quelques résultats plus par¬ 
ticulièrement marquants à notre point de vue. 

Sur le plan méthodologique, l’approche cognitive en psychologie a ap¬ 
porté quelques innovations marquantes en tête desquelles il convient de men¬ 
tionner d’une part la simulation des processus cognitifs d’un sujet confronté à 
une tâche donnée, et d’autre part le recours très fréquent à des modèles du 
fonctionnement mental. Il s’agit plus d’apports complémentaires que d’une ré¬ 
volution méthodologique. En effet, bien qu’on ait rarement recours en psycho¬ 
logie cognitive aux analyses statistiques complexes, cela ne signifie pourtant 
pas que l’expérimentation ait été abandonnée. Mais diverses techniques 
d’analyses ont été soit créées, soit utilisées préférentiellement. 

En fonction de la centration sur les processus, plutôt que les structu¬ 
res, on a eu plus particulièrement recours à des variables comme les temps de 
réaction ou les mouvements oculaires. De même les protocoles verbaux ont 
connu un regain d’intérêt de la part des chercheurs, notamment ceux tra¬ 
vaillant sur la résolution de problèmes, tout comme l’analyse qualitative des 
données (types d’erreurs, etc.). Comme autre tendance caractérisant la plu¬ 
part des travaux cognitivistes, on peut noter une centration sur les comporte¬ 
ments individuels envisagés dans leur complexité, plutôt que l’intégration 
d’un grand nombre de données provenant d’échantillons de sujets. 


2. QUELQUES EXEMPLES 

D'ANALYSE DES PROCÉDURES 


Pour mieux cerner l’apport de la psychologie cognitive dans le domai¬ 
ne qui nous intéresse ici, il semble indiqué d’examiner quelques exemples pa¬ 
radigmatiques de l’utilisation de l’approche cognitive pour l’évaluation des 
compétences et la description des procédures des élèves au prise avec des 
opérations ou des problèmes mathématiques. 

Dans la suite de ce chapitre, nous avons choisi de développer et dis¬ 
cuter brièvement quelques recherches parmi les plus représentatives à notre 
point de vue. Il va de soi que ce choix est arbitraire et donc critiquable. Un des 
critères qui a permis de les retenir comme représentatives des apports de la 
psychologie cognitive réside dans le fait qu’elles comportent des analyses 
d’une complexité telle qu’il aurait été diffi cile de les mener à bien sans le con- 
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cours de moyens informatiques. Les travaux retenus concernent d’une part 
les opérations arithmétiques qu’elles soient orales ou écrites, et d’autre part 
les conduites observées lors d’épreuves inspirées peu ou prou de la théorie 
piagétienne. 

2.1 Analyse chronométrique des opérations arithmétiques 

Deux études consacrées à ce thème (Groen et Parkman, 1972; Woods, 
Resnick, et Groen, 1975) ont connu un succès d’estime considérable si l’on en 
juge par les nombreuses citations auxquelles elles ont donné lieu avant d’être 
répliquées et discutées. Dans les deux cas, le fonctionnement mental d’un 
groupe de sujets confrontés à une tâche arithmétique élémentaire (additions 
et soustraction de 2 nombres) est inféré à partir des temps de latence. Entre 
les solutions par comptage des tout petits et les solutions par simple évocation 
des résultats mémorisés qu’on peut observer dès que les tables sont suffisam¬ 
ment connues, il semble y avoir une période où les enfants calculent mentale¬ 
ment selon des procédures inventées par eux. Ce sont ces conduites que les 
deux groupes de chercheurs ont étudiées. 

Ces deux groupes de chercheurs ont testé une famille de modèles pos¬ 
sibles tant pour l’addition de deux nombres dont la somme est inférieure à 10 
que pour la soustraction de deux nombres. Tous ces modèles postulent l’exis¬ 
tence d’un compteur qui doit être initialisé à une certaine valeur, avant d’être 
incrémenté un certain nombre de fois, puis «lu» pour donner le résultat. En 
faisant l’hypothèse que les opérations élémentaires prennent un temps relati¬ 
vement constant, les différents modèles permettent de faire des prévisions sur 
l’allure des distributions des temps de latence. 

La comparaison des configurations de temps de réaction observés 
chez différents groupes d’élèves avec ceux que prédisent les différents modè¬ 
les a suggéré aux auteurs une interprétation selon laquelle les enfants les plus 
jeunes (1ère année) utilisent déjà le «MIN MODEL» pour l’addition, qui se ca¬ 
ractérise par le fait que les élèves déterminent d’abord quel est l’addende 
maximum, ce qui leur permet ensuite de n’incrémenter qu’un nombre mini¬ 
mum de fois. Les seules exceptions concernent les additions doubles (2+2 / 
3+3 / 4+4) qui prennent nettement moins de temps. Cette exception serait ex¬ 
plicable par le fait que les sujets parviennent à mémoriser les résultats de ces 
opérations plus rapidement que ceux des autres calculs; ils utiliseraient donc 
un processus de nature différente. Ce même modèle conviendrait également 
pour les résultats d’additions jusqu’à des sommes de 18 et avec des enfants de 
4 1/2 à 9-10 ans, comme d’autres recherches l’ont indiqué ultérieurement. 

Siegler a consacré différents articles à la critique de l’usage exclusif de 
la chronométrie mentale pour inférer les procédures des sujets (Siegler, 1987; 
1989). Ayant répliqué l’expérience en question, il a en outre interrogé les su¬ 
jets immédiatement après la réponse pour connaître la stratégie qu’ils avaient 
utilisée. Les résultats de ses études montrent que les sujets, loin de suivre pra- 
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tiquement tous la même procédure comme le suggéraient les résultats des 
études originales, utilisent une grande diversité de stratégies. Siegler montre 
ainsi les dangers d’une analyse superficielle. Utilisée de manière exclusive, la 
technique chronométrique peut conduire à des interprétations erronées, alors 
que si elle est utilisée conjointement à d’autres techniques, elle peut se révéler 
féconde. 

Ces résultats de Siegler confirment d’ailleurs une étude plus ancienne 
de Lankford (1972) sur les quatre opérations élémentaires auprès de 176 élè¬ 
ves de 7ème année qui montrait déjà que les stratégies de calcul sont très in¬ 
dividuelles et ne suivent pas forcément les modèles canoniques appris en 
classe ou dans les manuels. En outre, ces élèves utilisaient fréquemment le 
comptage dans les calculs et Lankford avait observé des différences entre les 
stratégies des bons calculateurs et celle des moins bons. 

Dans le même ordre d’idées, on peut mentionner les travaux ayant 
trait à ce qu’on appelle l’étude des savoirs quotidiens. A la suite de recherches 
entreprises initialement dans le domaine de la psychologie interculturelle, di¬ 
verses équipes se sont penchées sur la comparaison des connaissances scolai¬ 
res et des connaissances acquises d’une manière informelle à travers 
différents types d’activités (petit commerce sur les marchés, tissage, poterie, 
etc.). En restant proche du domaine des connaissances mathématiques, on 
peut citer notamment les travaux du groupe de Recife (Carraher, Carraher & 
Schliemann, 1987; Nîmes, Schliemann & Carraher, 1993). Ces chercheurs ont 
comparé les performances d’enfants des écoles de l’état de Pemambuco dans 
le Nordeste brésilien âgés de 8 à 13 ans pour divers problèmes d’arithmétique. 
Ces travaux ont mis en évidence des procédures bien différentes selon le con¬ 
texte de présentation des opérations et la supériorité des procédures orales 
inventées par les enfants pour résoudre les problèmes par rapport aux algo¬ 
rithmes écrits enseignés en classe. D’autres travaux ont confirmé la supériori¬ 
té des connaissances quotidiennes sur les connaissances purement scolaires. 

On peut voir dans ce type de travaux l’origine lointaine du courant ac¬ 
tuel qui, s’inspirant notamment des conceptions de Vygotsky, met l’accent sur 
l’importance du contexte dans l’acquisition des connaissances (situated lear- 
ning, situated cognition) et sur la nature nécessairement sociale de la connais¬ 
sance. Bien que plusieurs des auteurs de ces travaux récents aient appartenu 
au courant cognitiviste (en particulier Brown et Collins), ils ont opéré une 
nouvelle révolution et la filiation avec leurs anciennes recherches est parfois 
di f ficile à retracer. 

2.2 Modèles de diagnostic de Brown et Burton 

A la fin des années 70, l’article de Brown et Burton (1978) sur les mo¬ 
dèles de diagnostic a connu un grand succès dans les milieux intéressés. A 
partir de l’idée que la compréhension de la nature des erreurs des élèves est 
une condition sine qua non pour une remédiation efficace, Brown et Burton 
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se sont efforcés de parvenir à un diagnostic automatique des erreurs d’un élè¬ 
ve sur la base de l’analyse de l’ensemble des réponses obtenues à un test com¬ 
prenant 15 soustractions écrites. Ils ont élaboré un programme (BUGGY) 
destiné à analyser les patterns de réponses des élèves pour découvrir les 
«bugs» qui se sont infiltrés dans la procédure algorithmique. 

Ils font observer que si additionner ou soustraire deux nombres n’est 
pas très difficile, diagnostiquer à coup sûr les erreurs dans ces opérations peut 
se révéler assez subtü. Contrairement à l’opinion répandue chez de nombreux 
parents et enseignants selon laquelle les erreurs proviennent du fait que les 
élèves ne suivent pas très bien les procédures apprises, ces auteurs font en 
outre l’hypothèse que les élèves suivent au contraire très bien les procédures, 
mais qu’il s’agit souvent de procédures (au moins en partie) fausses. 

Leur but est de parvenir, pour chaque élève considéré, à un modèle de 
diagnostic, c’est-à-dire une représentation de la connaissance procédurale qui 
décrit l’intériorisation de la procédure par l’élève comme une variante d’une 
version correcte de cette procédure. Ayant analysé les résultats de près de 
1300 élèves au moyen d’une technique sophistiquée reposant sur l’intelligence 
artificielle, ils ont pu montrer que l’on pouvait déceler des erreurs systémati¬ 
ques susceptibles de donner lieu à une remédiation spécifique chez près de 
40% des élèves. 

Selon le point de vue que l’on adopte, ce pourcentage peut sembler 
faible puisque pour la majorité des élèves on n’a pas de diagnostic, ou au con¬ 
traire on peut être impressionné par le fait qu’il soit possible de mettre en évi¬ 
dence des déviations systématiques de procédures chez des élèves dont on ne 
connaît que leurs réponses à 15 opérations. Les données analysées prove¬ 
naient en effet d’une étude menée antérieurement au Nicaragua par un autre 
groupe de recherche et dont les résultats bruts avaient été stockés sur cartes 
perforées. Donc les auteurs de l’analyse ne pouvaient rien connaître des élè¬ 
ves en question et si les diagnostics avaient pu être validés et se révéler cor¬ 
rects, un tel pourcentage aurait permis d’entreprendre auprès de nombreux 
élèves des actions de remédiation relativement efficaces car bien ciblées. 

Brown et Burton ont également pu identifier les types d’erreurs les 
plus fréquents ce qui pourrait se révéler utile aux enseignants soucieux de 
prévenir de telles conséquences par des exercices appropriés. Il me semble 
qu’il était également important, du point de vue pédagogique, d’attirer l’atten¬ 
tion sur le fait que des tests moyennement réussis (permettant souvent d’ob¬ 
tenir des notes suffisantes !) peuvent masquer des acquisitions partiellement 
défectueuses. Même si des réflexions de ce type étaient possibles avant cette 
étude, les auteurs me semblent en avoir fait une démonstration particulière¬ 
ment convaincante. 

Sans doute plus intéressés par les questions fondamentales, ils se sont 
ensuite attachés à simuler la genèse des erreurs systématiques chez le sujet 
(Brown & VanLehn, 1980, 1982; VanLehn, 1987), s’écartant ainsi des aspects 
pédagogiques et diagnostiques pourtant très présents dans le premier article. 



La mathématique 


En effet, si les points rappelés ci-dessus sont relativement bien connus, l’as¬ 
pect plus particulièrement pédagogique de l’article a lui presque totalement 
passé inaperçu. Il comporte pourtant des idées intéressantes qui n’ont pas été 
totalement exploitées à notre connaissance. Parmi celles-ci, je mentionnerai 
en particulier les conseils pour la mise au point de tests apportant des infor¬ 
mations riches et interprétables de manière univoque (Brown & Burton, 1978, 
pp 183-184), ainsi que l’usage du programme à des fins de formation des fu¬ 
turs enseignants. L’augmentation de la puissance des ordinateurs personnels 
à laquelle nous avons assisté ces dernières années, et qui se poursuit voire 
s’accentue, autoriserait probablement la vulgarisation et une large diffusion 
de tels produits informatiques auprès des milieux de l’enseignement, ce qui 
eut été impensable il y a une quinzaine d’années lors du développement des 
prototypes de ces programmes. 

Une approche très similaire à celle de Brown et Burton a été adoptée 
par Hasemann (1986) dans son article sur les erreurs dans le calcul des frac¬ 
tions; toutefois cet auteur s’est inspiré pour ses analyses de concepts tels que 
celui de «frame» développé par Minsky (1975) et de «mécanismes 
hypothétiques» de Davis et McKnight (1979). Il a également trouvé une gran¬ 
de diversité dans les conduites des enfants qu’il attribue aux représentations 
des concepts mathématiques propres aux différents élèves. 

Dans son ouvrage sur l’évaluation formative des apprentissages, Scal- 
lon (1988) fait une revue de littérature très complète des travaux consacrés à 
l’analyse des erreurs systématiques. Une telle démarche a été adoptée pour 
traiter de très nombeux domaines appartenant soit aux mathématiques, soit à 
l’apprentissage de la langue. Scallon souligne en conclusion du chapitre con¬ 
sacré à cet examen combien cette approche est intéressante à titre d’esprit 
devant guider la réflexion des enseignants plutôt que comme technique d’éva¬ 
luation prête à l’usage. 

2.3 Reconstitution de règles 

ou stratégies suivies par les sujets 

De nombreuses recherches se sont centrées sur les stratégies de réso¬ 
lution de problème et il serait illusoire de tenter ici d’en faire l’inventaire. No¬ 
tre choix s’est porté sur une étude de Siegler dont la méthode est 
particulièrement intéressante pour notre propos. Reprenant le problème de 
l’équilibre de la balance étudié par Inhelder et Piaget (1955), avec une métho¬ 
dologie profondément renouvelée, Siegler (1988) s’est efforcé de reconstituer 
les «programmes» ou règles que semblent suivre les sujets pour produire 
leurs réponses à une tâche où il s’agit de formuler des prévisions quant à l’état 
du dispositif en fonction de diverses répartitions des poids. 

Siegler a élaboré quatre modèles de complexité croissante sous la for¬ 
me d’un arbre de décision que le sujet est censé parcourir en répondant à des 
questions élémentaires sur le dispositif (Les poids de part et d’autre de la ba- 
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lance sont-ils égaux ? / Les distances sont-elles égales ?). En fonction des ré¬ 
ponses apportées à ces questions, le sujet parvient à fournir une réponse à la 
question de l’expérimentateur. Chacun des quatre modèles postulés par Sie- 
gler correspondait en gros aux étapes du développement décrites par les 
auteurs genevois. 

Ces modèles ont la particularité de permettre à l’auteur une prédic¬ 
tion de l’allure des courbes de développement avec l’âge différenciées selon la 
nature des situations présentées aux sujets. C’est ainsi que pour l’une des ca¬ 
tégories de problème (« conflit-poids »), les hypothèses basées sur une analyse 
de type traitement de l’information prévoyaient une régression avec le modèle 
III. Les résultats confirment cette évolution, bien que le redressement final 
n’ait pas été observé, même avec le groupe des sujets les plus âgés (15-16 
ans). 

En appliquant des critères assez stricts, Siegler a montré que les su¬ 
jets pouvaient dans leur grande majorité être «diagnostiqués» comme utilisa¬ 
teur d’un des modèles. L’absence quasi totale du modèle optimal même chez 
les plus âgés expliquerait le fait que la situation «conflit-poids» ne donne pas 
lieu à une réussite majoritaire après la baisse de performance en fonction de 
l’âge. 

Une équipe québécoise a répliqué cette étude de Siegler en critiquant 
certains aspects de son approche (Larivée, Normandeau, Roulin & Longeot, 
1987). Selon eux, le modèle n’intègre pas toutes les règles possibles et il passe 
sous silence la variabilité intra-individuelle. A travers leur analyse, les auteurs 
mettent en évidence trois autres règles dont celle de l’additivité, consistant à 
«additionner le poids et la distance de chaque côté du fléau et à conclure que 
la balance penchera du côté où la somme est la plus élevée» (Larivée & al, 
1987, pp. 521-522). Ils soulignent aussi la trop grande généralité de la Règle 
III du modèle de Siegler puisque parmi les 77 sujets qui seraient classés com¬ 
me utilisateurs de la Règle III avec l’analyse de Siegler, 33 sujets utilisent en 
fait la règle de l’additivité. 

Des tentatives ont été entreprises pour appliquer un schéma similaire 
au cas de l’utilisation d’un traitement de texte (Desmarais, Larochelle, & Gi- 
roux, 1987). Par la simple observation (automatique) des actions d’un utilisa¬ 
teur, il s’agit de déterminer l’état actuel de ses connaissances, des facilités 
offertes par le programme, afin de pouvoir lui donner quelques conseils judi¬ 
cieux. Le but est de parvenir à programmer un «coach» simulant l’activité 
d’un moniteur qui chercherait à faire progresser les utilisateurs en leur suggé¬ 
rant des méthodes plus économiques ou des raccourcis, etc. 

2.4 Étude des stratégies des joueurs d'awélé 

Au-delà du problème de la balance, cette méthode, «rule- 
assessment» ou «par élaboration de règles» selon la traduction adoptée par 
Larivée, est susceptible de s’appliquer à d’autres types de tâches. Nous illus- 
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trerons une telle transposition par la présentation un peu plus détaillée d’une 
recherche menée en Côte d’ivoire sur les stratégies des joueurs d’awélé, à l’oc¬ 
casion de laquelle nous avons également eu recours à une technique similaire 
en complément d’autres approches pour tenter d’identifier les stratégies des 
enfants dans la pratique de ce jeu qui nécessite notamment des raisonne¬ 
ments de type numérique (Retschitzki, 1990). En raison de la pauvreté des 
verbalisations des joueurs quant à leurs stratégies, il s’est avéré très précieux 
de disposer d’un moyen supplémentaire d’investigation à ce sujet. 

2.4.1 Présentation du jeu d'awélé 

Le jeu d’awélé appartient à la classe des jeux de semailles. Nous avons 
étudié la variante qui se joue chez les Baoulés de Côte d’ivoire. L’awélé se joue 
à 2, avec un «tablier» (une planche de bois creusée de 2 rangées de 6 trous). 
Au départ chaque case contient 4 graines. A tour de rôle chacun des joueurs 
vide le contenu d’une case qui se trouve de son côté et sème les graines dans 
les cases suivantes, à raison d’une graine par case, dans le sens inverse des 
aiguilles d’une montre. Le but du jeu est de récolter plus de la moitié des grai¬ 
nes chez l’adversaire. Une récolte est possible lorsque le joueur termine sa se¬ 
maine dans une case qui contient déjà une ou deux graines portant ainsi le 
contenu à 2 ou 3 graines. Le joueur a de plus le droit de récolter le contenu de 
toutes les cases précédentes satisfaisant au même critère. 

Pour appréhender les stratégies des joueurs, notamment des enfants, 
il était difficile d’avoir recours à la méthode «thinking aloud», souvent em¬ 
ployée avec les sujets adultes dans les études cognitivistes sur des thèmes si¬ 
milaires. C’est pourquoi nous avons tenté de recueillir le maximum 
d’informations en combinant différentes techniques : observation directe, 
épreuve de connaissance du jeu, observation différée (grâce aux enregistre¬ 
ments vidéo), analyse détaillée des parties après transcription, interrogation 
de joueurs adultes, analyse de situations de jeu par les adultes, etc. 

En plus, nous avons eu recours avec les enfants à une épreuve papier- 
crayon inspirée des problèmes d’échecs qu’on trouve dans les journaux ou pé¬ 
riodiques. Ce sont les données de cette épreuve qui seront discutées plus en 
détail ci-dessous. 


2.4.2 Méthode 

Nous nous sommes efforcés de constituer un ensemble de situations 
aussi varié que possible pour déceler les règles que les sujets semblent suivre 
en choisissant un coup dans différentes circonstances du jeu. On présentait 
aux sujets un ensemble de configurations de jeu représentées symbolique¬ 
ment. Les sujets devaient simplement indiquer par une flèche quelle case il 
leur semblait préférable de jouer du point de vue du joueur dont les quantités 
de graines étaient représentées dans la rangée inférieure. 
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La confrontation des réponses des sujets avec l’analyse des sujets de¬ 
vrait permettre de formuler des hypothèses sur le type de processus cognitif 
utilisé par les sujets. Dans quelle mesure s’en tiennent-ils à une analyse stati¬ 
que ou au contraire sont-ils capables d’anticipation, et si oui, jusqu’à quelle 
profondeur ? Tel est le genre de question que le dépouillement de cette épreu¬ 
ve devrait aider à clarifier. 

Ce qui caractérise cette épreuve et rend son exploitation relativement 
complexe, c’est qu’il n’y a pas à proprement parler de «bonne réponse», mais 
que l’évaluation d’une réponse dépend de l’objectif que s’assigne le joueur. 

L’une des difficultés de cette démarche réside dans le fait qu’on ne 
peut pas interpréter à coup sûr une réponse isolée. Le choix du même coup 
peut en effet s’expliquer de différentes manières, surtout dans un jeu où le 
nombre de coups possibles est au maximum de 6. Ce n’est que par la prise en 
compte de la totalité des réponses qu’on peut espérer approcher le 
«programme» réel des sujets, pour autant que leur manière d’opérer le choix 
du meilleur coup soit relativement cohérente et stable tout au long de 
l’épreuve. 

Confronté à une configuration qui représente une situation du jeu 
d’awélé, les sujets doivent choisir au maximum parmi 6 réponses possibles. 
Pour établir les différents modèles qui doivent être confrontés aux réponses 
réelles, on peut formuler des hypothèses sur les informations traitées par les 
sujets, l’ordre dans lequel elles sont prises en considération. 

Compte tenu des règles du jeu, un certain nombre de critères sem¬ 
blent pertinents : 

- Priorité à l’aspect offensif (aspect défensif négligé) ou l’inverse. 

- Décision dès qu’un coup apparaît productif vs décision après examen 
global. 

- Comparaison des aspects offensifs et défensifs. 

- Examen des cases de gauche à droite ou l’inverse. 

- Perception de toutes les menaces potentielles ou ignorance des mena¬ 
ces de moyenne ou longue distance 


2 . 4.3 Modélisation des configurations de réponses 

Dans le but de trouver les règles que semblent suivre les sujets, des 
modèles hypothétiques ont été élaborés et les prédictions qu’ils fournissent 
confrontées avec les réponses réelles des sujets. Le Tableau 1 présente quatre 
exemples de modèles pour illustrer le principe de la démarche : 
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Tableau 1 

Exemple de modèles des stratégies pour l'épreuve des problèmes d'awélé 

Les cases sont examinées dans l'ordre droite-gauche 
Chaque case est testée pour les récoltes possibles 
Dès qu'une récolte possible est décelée, on choisit cette case 
Si aucune récolte n'est décelée, pas de prévision 



Tester chaque case pour les menaces selon l'ordre G-D 


Dès qu'une perte est possible, jouer la case menacée 

M14 

Tester chaque case pour les récoltes selon l'ordre D-G 


Dès qu'un gain est possible, jouer la case 


Sinon, pas de prévision 


Faire l'inventaire des menaces et des récoltes 

Comparer gain maximum et perte maximum 

Jouer la case avec conséquence maximale 

En cas d'égalité des effets, priorité à la récolte 

Si plusieurs cases ont le même effet, choisir selon l'ordre G-D 

Sinon, pas de prévision 


M42 


Appliquer l'algorithme minimax avec une profondeur de 2 
Choisir le meilleur coup selon cette procédure 
En cas d'égalité, choisir la case la plus à droite 


Un exemple de problème n’est pas inutile pour concrétiser la démar¬ 
che suivie. Le problème No 126 se présentait de la manière suivante (cf. Figu¬ 
re 1). 


1 

4 

6 

6 

2 

0 

2 

1 

1 

2 

1 

6 


Figure 1 

La situation du problème 126 

Dans le cas de ce problème, les 4 modèles prédisent les réponses sui¬ 
vantes, ainsi que l’indique le Tableau 2. 












Apport et limites de la psychologie cognitive à l'analyse des procédures de calcul et de résolution 


Tableau 2 

Réponses prédites pour le problème 126 par les quatre modèles retenus 


MOI 

M14 

M26 

M42 

6 

1 

4 

3 


2.4.4 Principaux résultats 

Pour avoir une vision synthétique des tendances qui se dégagent de 
l’analyse, les différents modèles peuvent être regroupés en trois grands grou¬ 
pes selon l’approche du problème qui les caractérise : 

1. Les modèles caractérisés par un examen partiel de la situation 

2. Les modèles caractérisés par un examen global de la situation 

3. Les modèles dérivés d’une analyse exhaustive (algorithme minimax) 

En analysant les concordances entre les prédictions basées sur les dif¬ 
férents modèles et les réponses observées, on peut dégager les principales 
tendances des résultats. Pour chaque sujet, on calcule autant de scores de 
concordance qu’il y a de modèles. Une correspondance complète entre les 
prédictions des modèles et les réponses réelles est relativement peu fréquen¬ 
te. On ne trouve un ou des modèles expliquant la quasi totalité des réponses 
que chez 6 sujets sur 28. 

Tableau B 

Répartition des sujets selon la catégorie de modèle 


Aspect privilégié 

Examen de 

Partiel 

la situation 

Global 

Offensif 

1112 1313 

1113 1315 

1114 1502 

1305 

1514 

Défensif 

1105 

1115 

1302 

1111 

1303 

Offensif + défensif 


1101 1304 1501 

1102 1312 1504 

1103 1314 1511 

1104 1512 

Sujets inclassables 

1311 1530 

1513 
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Le Tableau 3 indique la répartition des sujets dans les grandes catégo¬ 
ries de modèles. On peut relever que parmi les 9 sujets qui semblent choisir 
leur coup après un examen superficiel on trouve surtout des sujets de 11 ans. 
Inversement parmi ceux qui semblent procéder à un examen global et en te¬ 
nant compte aussi bien des aspects offensifs que des aspects défensifs, on 
trouve la majorité des sujets de 15 ans. 

On notera également que parmi les sujets inclassables figure le sujet 
1503, le meilleur joueur de l’échantillon. Cela pourrait indiquer qu’aucun mo¬ 
dèle ne correspond au meilleur choix possible. Il pourrait s’avérer nécessaire 
d’élaborer de nouveaux modèles pour simuler les comportements non encore 
expliqués. 

En examinant les résultats selon les modèles et la fréquence avec la¬ 
quelle les différents sujets semblent raisonner d’une telle manière, on peut re¬ 
marquer la prédominance des modèles accordant la priorité à l’aspect offensif, 
ainsi que la grande fréquence des modèles reposant sur une analyse partielle 
de la situation proposée. 

Inversement, les modèles reposant sur une anticipation exhaustive de 
type minimax sont presque totalement absents. On ne trouve de bons scores 
que chez quelques sujets pour une feuille donnée. Cela semble indiquer que 
ce n’est pas en se livrant à une étude de tous les coups possibles que les sujets 
se sont déterminés. Ou pas seulement de cette manière, mais que d’autres élé¬ 
ments ont été pris en considération, ce qui n’est psychologiquement guère 
surprenant. 

2 . 4.5 Discussion 

A l’issue de l’analyse esquissée ci-dessus, quelques remarques s’impo¬ 
sent quant à l’utilité de la méthodologie retenue. En premier lieu, on peut sou¬ 
ligner la richesse des indications fournies par le dépouillement de cette 
épreuve, alors que l’effort demandé aux sujets s’est révélé relativement peu 
important et que la passation a duré très peu de temps. La principale limite de 
cette épreuve pourrait résider dans l’absence de représentativité des réponses 
par rapport à la conduite qui nous intéresse, à savoir le choix d’un coup dans 
une situation réelle. La situation d’examen est en effet assez éloignée de la si¬ 
tuation d’une vraie partie d’awélé. Outre les différences objectives évidentes 
(absence d’adversaire, test papier-crayon, absence d’enjeu, etc.), une diffé¬ 
rence très importante réside dans l’absence d’un contexte. Dans une partie 
réelle, le joueur connaît le score approximatif de chacun des adversaires et ses 
choix sont très probablement influencés par cette connaissance. Selon qu’il 
mène largement, qu’il est distancé ou que les positions sont équilibrées, il 
pourra décider ou non de jouer tel coup dont l’issue lui semble incertaine. 
Dans la situation des problèmes d’awélé, rien de tel ne vient orienter les choix 
des sujets. Incontestablement, il y a là un aspect un peu artificiel de la situa¬ 
tion. On peut cependant penser que cette difficulté est peut-être moins impor¬ 
tante dans le cas des garçons de 9 à 15 ans que ce ne serait le cas pour des 
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adultes, sans doute plus sensibles à la situation stratégique générale et domi¬ 
nant mieux l’ensemble des aspects pertinents d’une situation de jeu. De plus, 
les résultats ont bien montré que les sujets ne répondaient pas de manière 
aléatoire. 

Différentes mesures pourraient être envisagées pour améliorer la cor¬ 
respondance entre prédictions et réponses; il conviendrait en premier lieu 
d’affiner les modèles, d’en créer de nouveaux; on pourrait aussi tenter d’éla¬ 
borer un ensemble de problèmes conçus de manière plus systématique en vue 
de mieux vérifier des aspects particuliers des conduites visées. Mais cette pre¬ 
mière expérience était sans doute nécessaire pour vérifier qu’un tel effort mé¬ 
rite d’être entrepris. 

Au total, à condition d’utiliser ce type d’épreuve comme complément 
à d’autres approches des stratégies des joueurs, elle nous semble être très uti¬ 
le et transposable à d’autres situations ou jeux et dans des contextes variés. 
Mais il convient d’insister sur le fait que cette méthode nécessite une analyse 
approfondie du domaine étudié et peut donc se révéler assez coûteuse. 

3. ÉVALUATION DE CES TRAVAUX 


Au terme de cette présentation de quelques recherches classiques re¬ 
présentatives de l’approche cognitive, il convient de tenter d’établir un bilan 
(au moins provisoire) des forces et des faiblesses de cette approche pour 
l’évaluation des procédures. Précisons que ces remarques sont avant tout va¬ 
lables pour les retombées directes des travaux cognitivistes, sans prétendre 
porter un jugement au sujet de l’influence que la psychologie cognitive a pu 
avoir, a et aura encore sur les très nombreuses recherches des spécialistes de 
l’évaluation pédagogique. 

Les efforts entrepris dans le cadre du courant cognitiviste pour expli¬ 
quer de manière plus fine les conduites des sujets dans différentes situations 
ont permis une meilleure connaissance des manières de fonctionner des su¬ 
jets. Les conduites apparaissent plus complexes que les descriptions antérieu¬ 
res ou les études de type psychométriques ne le laissaient supposer. Cela 
explique le succès mérité de certains des travaux mentionnés précédemment 
lors de leur parution; ils donnaient véritablement l’impression d’une percée si¬ 
gnificative dans la connaissance psychologique. 

C’est particulièrement vrai dans le cas de la recherche de Brown et 
Burton, qui avait permis de mettre en évidence des particularités très riches 
de résultats obtenus bien auparavant et ce sans aucun contact direct avec les 
élèves concernés. Le «miracle» aurait paru plus convaincant encore si l’on 
avait pu procéder à une validation des résultats de l’analyse et si une remédia¬ 
tion avait pu être entreprise auprès des élèves concernés. Mais les données 
avaient été mises à disposition par un autre groupe de recherche et la collecte 
des données était trop ancienne pour permettre une telle démarche. 
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Même s’il ne s’agit pas d’une découverte entièrement nouvelle, l’ac¬ 
cent mis par le courant cognitiviste sur les aspects procéduraux a fortement 
contribué à enrichir notre connaissance dans le domaine des procédures de 
résolution de problème. C’est ainsi que la «créativité» dont font preuve les 
élèves qui inventent des procédures pour se débrouiller dans des situations li¬ 
mites est intéressante à observer. Les procédures enseignées à l’école ne sont 
que rarement suivies scrupuleusement, en tout cas pas immédiatement. Les 
élèves doivent d’abord se les approprier. D’autre part leurs performances dans 
des tâches scolaires ne correspondent pas toujours à leurs compétences réel¬ 
les comme l’ont montré les observations dans le milieu extra-scolaire. 

Enfin il faut créditer les études cognitives du fait d’avoir posé les pro¬ 
blèmes d’une manière renouvelée et permis ainsi d’entreprendre des recher¬ 
ches d’une ampleur nouvelle dans des domaines autrefois trop complexes 
pour être étudiés scientifiquement. 

Néanmoins ces travaux ont montré des limites qu’il convient égale¬ 
ment de mentionner et de discuter. On a vu les dangers, bien soulignés par 
Siegler (1987; 1989), d’une approche basée exclusivement sur une méthode 
chronométrique. Cela souligne la nature des théories en psychologie cognitive 
dont l’adéquation avec la réalité des processus sous-jacents reste toujours à 
confirmer. Cette remarque ne concerne bien entendu pas que les opérations 
arithmétiques et devrait nous inciter à la plus grande prudence et à toujours 
tenter de recouper les indications d’une approche par celles d’une autre. Je 
plaiderai donc pour une approche pluri-méthodologique. 

Malgré les points positifs incontestables des travaux rendus possibles 
par les nouvelles technologies et les paradigmes de nature cognitiviste, nous 
ne disposons pas réellement d’outils permettant à chaque enseignant d’amé¬ 
liorer son activité d’accompagnement des élèves confrontés à des difficultés 
de maîtrise des opérations ou des situations de résolution de problème. Les 
travaux comme ceux de Brown et Burton comportent pourtant des indications 
sur la possibilité de construction d’épreuves de contrôle réellement informan¬ 
tes non seulement sur le classement des élèves mais encore sur leurs difficul¬ 
tés spécifiques. Il est regrettable que ces pistes n’aient pas été explorées de 
manière suffisante à notre connaissance. Les études en sont généralement 
restées au niveau de prototypes intéressants surtout du point de vue des re¬ 
cherches fondamentales. 

Dans un récent article, Bejar et Braun (1994) indiquent que des sy¬ 
nergies leur semblent possibles entre l’évaluation et l’enseignement en raison 
de l’intersection des besoins entre ces deux types d’activités (évaluation des 
performances, feed-backs aux apprenants, etc.). Mais il semble encore s’agir 
plus d’une croyance et d’un voeu que du constat de réalisations effectives. 

On ressent donc une impression d’inachevé. Le versant application 
pédagogique des études semble surtout être mis en avant dans l’introduction 
et la conclusion des travaux, comme pour les légitimer ou pour justifier l’ob¬ 
tention des crédits de recherche. Mais la plupart du temps, il manque un réel 
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suivi des tentatives d’application pratique. Une des raisons pouvant expliquer 
le peu d’impact des recherches de psychologie cognitive fondamentale sur les 
travaux dans le domaine de l’évaluation réside peut-être dans la méconnais¬ 
sance de ces travaux par les chercheurs en place dans les instituts ou services 
de recherche pédagogique; si c’est le cas, avec le temps on devrait constater 
des évolutions significatives, car la psychologie cognitive a maintenant large¬ 
ment pénétré des cercles de plus en plus étendus. Il y a donc lieu d’être rela¬ 
tivement optimiste quant à la réalisation prochaine d’applications répondant 
aux attentes maintes fois exprimées à cet égard. 

4. TENDANCES RÉCENTES 


Au début des années 90, il apparaît toutefois que l’approche cognitive 
est à son tour remise en question. Neisser, dans un article récent, résume ce 
fait en écrivant «Cognitive psychology is in a period ofrapid and confu- 
sing change. Our old models... are being challenged by aflood of nevo 
discoveries. » (Neisser, 1994, p. 225). Il est bien difficile de savoir si l’appro¬ 
che cognitiviste connaît une simple crise de croissance ou si elle est sur la pen¬ 
te d’un réel déclin. Parmi les évolutions récentes s’écartant notablement de 
l’orthodoxie cognitive, il convient de mentionner le développement des théo¬ 
ries néo-piagétiennes, l’importance croissante des modèles néo-connexionnis- 
tes et l’apparition déjà citée plus haut du courant de «situated cognition». 

La conception connue sous le nom de «distributed cognition» (Salo¬ 
mon, 1993) mérite une mention particulière car si on la prend au sérieux, le 
problème de l’évaluation en est singulièrement compliqué. En effet dans son 
expression extrême, elle revient à nier qu’il soit pertinent de considérer la 
connaissance d’un individu, puisque toute connaissance est nécessairement 
distribuée entre plusieurs cerveaux. Une telle approche pourrait conduire à 
renoncer à toute évaluation. A tout le moins il faudrait revoir fondamentale¬ 
ment les manières de procéder puisqu’il convient alors d’évaluer le système 
comme tel, et non les performances d’un individu isolé. Il y a là de jolis défis à 
relever pour les spécialistes de psychologie pédagogique. 

Cela rejoint également les remarques de Papert dans son dernier 
ouvrage où il fait remarquer que les acquisitions importantes qui ont marqué 
sa vie intellectuelle se sont en fait déroulés en dehors de l’école (Papert, 1993, 
p. 23). Ce que nous tentons de mesurer, d’évaluer n’est-il de la même manière 
qu’un épiphénomène sans grande importance laissant de côté les aspects les 
plus essentiels des acquisitions cognitives ? 

Nous manquons encore de recul pour juger valablement tant les ap¬ 
ports du courant cognitif dont toutes les retombées ne sont pas encore con¬ 
nues que les apports potentiels des courants plus récents. Le bilan que nous 
avons tenté de tirer ne saurait donc être considéré que comme un instantané 
à réactualiser dans quelques années. 
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Introduction 

L’introduction de l’outil informatique dans les écoles permet d’y re¬ 
prendre une méthode d’investigation très fructueuse et très utilisée en psy¬ 
chologie cognitive : la mesure des Temps de Réponse (TR). Cette dernière 
s’applique particulièrement bien à l’étude de la mémorisation des faits numé¬ 
riques élémentaires, les tables si l’on préfère. 

Ranschburg, au début de ce siècle, en 1903 à Budapest précisément, 
avait mesuré les TR sur des élèves de première année d’école, en difficulté 
(débiles) ou non (cf. Ranschburg, 1930). 11 avait déjà observé la grande len¬ 
teur des premiers comparativement aux seconds et découvert quelques sub¬ 
tilités du traitement des additions comme le traitement particulièrement 
rapide et uniforme des doubles (e.g., 5+5). Mais les méthodes et problémati¬ 
ques piagétiennes ont ensuite, probablement, freiné cette utilisation des TR 
jusqu’à une époque récente où, consécutivement à l’article princeps de Groen 
et Parkman (1972) et grâce aux facilités matérielles nouvelles, on a pu assister 
à une explosion de la littérature (pour une revue, voir Ashcraft, 1992). 

Toutefois, la plupart de ces recherches ont été menées dans une pers¬ 
pective davantage psychologique que pédagogique. Ceci sous-entend que, 
souvent, on n’interroge qu’une partie des élèves d’une classe; la passation est 
individuelle; on se limite à une seule opération arithmétique; on ne se préoc¬ 
cupe que rarement de ce qui est essentiel pour les pédagogues, à savoir le pro¬ 
grès des élèves. 

Nous commencerons par présenter quelques problèmes de méthode 
et la manière dont nous les avons résolus. Ensuite, nous indiquerons deux ap¬ 
plications immédiates de nos propositions : d’une part, le diagnostic pour une 
classe en début d’année, d’autre part la mesure des progrès tout au long de 
l’année voire de plusieurs années. Enfin, nous présenterons des applications 
plus générales de l’étude des TR, mais dont l’intérêt est néanmoins évident 
pour l’apprentissage, la différenciation pédagogique et la remédiation : ces ap¬ 
plications concernent en effet le développement numérique, les différences 
individuelles et les sujets en difficulté. 

1. QUESTIONS DE MÉTHODE 

1.1 Tâche de vérification vs tâche de production 

1 . 1.1 , Les contraintes matérielles d'une tâche de production 

La mesure des TR devient aujourd’hui, grâce à l’équipement informa¬ 
tique, praticable dans les classes. Néanmoins, un problème pratique important 
continue à se poser : il est difficile de demander aux élèves de produire la ré¬ 
ponse, i.e. donner la réponse par exemple à 9+7. En effet, la mesure précise 
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des TR dans une tâche de production implique soit une réponse orale, soit des 
choix (de touches) multiples. 

Dans le premier cas, il faut un dispositif spécial permettant l’arrêt du 
chrono au début de la réponse orale (voir une description dans Miller, Perl- 
mutter & Keating, 1984, par exemple). Un tel dispostif risque de conduire à 
de nombreuses fausses alarmes (bruit ou réponse du voisin, éternuements, 
...) et n’est guère utilisable qu’en conditions de laboratoire. 

Dans le second cas, il se pose au moins deux problèmes : 

1. Celui du temps d’accès aux différentes touches-réponses. Pour 
réduire ce temps au maximum, il faudrait un entraînement consé¬ 
quent. Et même dans ce cas, on peut se demander s’il va être uni¬ 
forme (i.e., indépendant de la touche sur laquelle on appuie) : on sait 
en effet que, même chez des secrétaires professionnelles, le temps de 
frappe (qui est beaucoup plus court que le temps de réaction réflexe) 
pour un clavier QWERTY varie de 190.5 à 236.2 ms si l’on considère 
les seules lettres de la première rangée, ou de 168.7 à 279.2 ms si l’on 
considère l’ensemble des lettres (Salthouse, 1984); 

2. Celui de la taille du nombre-réponse. En effet, si ce dernier dépasse 
9, i.e. si la réponse est un nombre à deux chiffres, le temps de recher¬ 
che des touches contribuera pour une part extrêmement importante 
au TR final mesuré. Et si on se limite à des réponses inférieures à 10, 
les nombres utilisables pour les additions sont limités et, pire, les 
multiplications se trouvent presque exclues. 

1 . 1.2 Les spécificités d'une tâche de vérification 

La tâche de vérification - indiquer, par exemple, si 9+7 = 15 est juste 
- présente, comparativement à une tâche de production, certaines spécificités 
(Fischer, 1988b). La première, et probablement la plus importante, est qu’elle 
peut conduire à d’autres formes de vérification que le calcul procédural de la 
réponse ou sa récupération en mémoire déclarative. D’une part, parce que la 
fausseté d’une égalité peut être détectée sans faire le calcul, par exemple par 
un argument de parité (e.g., 6x7 = 43 est fausse car un produit dont l’un des 
termes est pair est nécessairement pair) ou par un jugement de plausibilité 
(e.g., 6x7 = 72 n’est pas plausible car 72 est supérieur à 10x7 = 70). D’autre 
part, parce que pour les opérations inverses - soustraction et division - le sujet 
peut inverser la stratégie de lecture : si un élève a mieux mémorisé la table de 
multiplication que celle de division, et doit vérifier 42 :7 = 6, il peut lire l’éga¬ 
lité de droite à gauche et vérifier que 6x7 = 42. 

Une tâche de vérification conduit, secondairement, à des effets non 
observables dans une tâche de production. Ont notamment été identifiés : (1) 
l’effet de positivité selon lequel une égalité correcte (e.g., 7x8 = 56) sera trai¬ 
tée plus rapidement qu’une égalité non trop grossièrement incorrecte (e.g., 
7x8 = 63); (2) l’effet d’interférence, ou de confusion, inter-opérations selon 
lequel une égalité incorrecte (e.g., 7+8 = 53) sera traitée plus rapidement 
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qu’une égalité, incorrecte aussi, mais pour laquelle la réponse proposée cor¬ 
respond au résultat d’une autre opération arithmétique appliquée aux deux 
termes de l’opération (e.g., 7+8 = 56). Ce dernier effet est particulièrement 
intéressant pour éprouver des modèles théoriques de représentation en mé¬ 
moire. Il a ainsi donné lieu, consécutivement à sa première mise en évidence 
par Winkelman et Schmidt (1974), à une pléthore de recherches : Frenck- 
Mestre et Vaid (1993), Lemaire et al. (1991, 1994), pour n’en citer que quel¬ 
ques-unes récentes. Toutefois, l’intensité des effets obtenus dans ces différen¬ 
tes recherches ne semble pas suffisante pour leur attribuer une grande 
pertinence pédagogique. 

La tâche de vérification ne peut donc pas être simplement décrite 
comme une tâche de production à laquelle s’ajouterait un stade de comparai¬ 
son avec la réponse proposée (Campbell, 1987; Zbrodoff & Logan, 1990), 
même s’il existe quelques évidences contraires (Timmers & Claeys, 1990) dis¬ 
cutées dans Fischer (1992, p.103). 

1 . 1.3 La validité de la tâche de vérification 

Les contraintes matérielles de la tâche de production nous ont con¬ 
duit à choisir une tâche de vérification dans la méthode Juste-Faux exposée 
ci-après. Les spécifités de la tâche de vérification, que nous venons de résu¬ 
mer, nous ont alors incité, lors de nos premières observations suivant la mé¬ 
thode Juste-Faux, à étudier la corrélation avec la forme d’évaluation 
habituellement en vigueur dans les classes concernées. Malheureusement, 
nous n’avons qu’assez rarement trouvé des notes de calcul mental, a fortiori 
d’évaluation de la connaissance des tables élémentaires. Nous avons donc sou¬ 
vent dû nous résigner à calculer une corrélation avec des performances en cal¬ 
cul écrit, voire en mathématique plus généralement. Le bilan de ces analyses 
de corrélations - nous en rapportons une précise dans l’illustration de la partie 
2 suivante - est qu’elles sont significatives et bonnes, sans être parfaites. Un 
tel résultat nous paraît tout à fait rassurant pour la méthode : d’une part, du 
fait que la corrélation est significativement bonne, il montre que l’on ne mesu¬ 
re pas n’importe quoi; d’autre part, du fait que la corrélation n’est pas parfaite, 
il montre aussi que l’évaluation ne fait pas double-emploi avec d’autres formes 
d’évaluation. 

Par ailleurs, même si la tâche de vérification ne mesure peut-être pas 
exactement la même chose que la tâche de production, et peut conduire à la 
mise enjeu de traitements différents, on peut remarquer qu’elle ne devrait pas 
entraver la réussite d’un élève qui ne saurait que produire les faits numériques 
élémentaires. En effet, un tel élève pourra toujours utiliser cette connaissance 
pour répondre correctement, même si, à défaut de stratégie plus efficiente, sa 
vitesse de réponse pourrait laisser à désirer. En outre, la tâche de vérification 
possède un intérêt propre, et croissant avec l’utilisation de plus en plus répan¬ 
due des calculettes et ordinateurs. 
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1.2 La méthode Juste-Faux (Fischer, 1988a) 

1 . 2.1 Phase de production des données 

La méthode repose principalement sur la mesure des TR. De manière 
plus précise, elle s’appuie sur un programme destiné aux élèves en fin d’école 
élémentaire (CE à CM), en début de collège ou en Section d’Etudes Spéciali¬ 
sées. La figure 1 présente le décours temporel d’une question. 
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Figure 1 

Décours temporel d'une question. 

Outre le choix méthodologique principal que constitue la mesure des 
TR, et celui d’une tâche de vérification que nous venons de commenter, 
d’autres choix, dont l’importance est loin d’être négligeable, ont été faits sub¬ 
séquemment. Nous les explicitons rapidement. 

1. La limitation du temps de réponse : la figure 1 fait apparaître que les 
élèves n’ont qu’un délai limité pour répondre. Ce délai peut être 
choisi dans le programme d’initialisation entre 2 et 9 secondes. 

2. La nature - additions, soustractions, multiplications, ou divisions - 
des opérations à proposer. Vu l’objectif d’évaluation et de comparai¬ 
son (inter-opérations), les quatre types d’opérations sont égale¬ 
ment représentés. 

3. Les deux modalités de présentation : lors de l’une des deux passa¬ 
tions exigées par la méthode, l’élève se voit proposer 14 additions, 
puis 14 soustractions, puis 14 multiplications et enfin 14 divisions 
(modalité REGroupement), en étant prévenu, avant chaque bloc de 
14, de la nature de l’opération suivante; au cours de l’autre passation, 
il se voit proposer les opérations «mélangées» (modalité Non- 
REGroupement), en ignorant la nature de l’opération suivante. 

4. Les égalités : le programme d’initialisation de Juste-Faux permet de 
choisir entre plusieurs jeux d’égalités. Ces égalités ne «sortent» 
jamais des tables élémentaires. La figure 2 montre qu’elles sont parta¬ 
gées en deux niveaux : sans définir précisément ces derniers, on peut 
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dire que le niveau 1 concerne les faits arithmétiques portant sur des 
petits nombres (e.g., 2x3 = 6), alors que le niveau 2 concerne des 
faits portant sur des nombres plus grands (e.g., 6x8 = 48). 

5. Les deux passations : chaque session d’évaluation comprend deux 
passations. On en «profite» pour varier la modalité de présentation 
(REG ou NREG) et pour présenter un autre sous-jeu d’égalités. 

1 . 2.2 Phase de traitement des données 

Une fois que l’ensemble des élèves d’une classe ou d’un groupe a ef¬ 
fectué les deux passations, des programmes de traitement permettent d’ana¬ 
lyser leurs TR signés, i.e. pour lesquels un code précise s’ils correspondent à 
une réponse correcte, incorrecte ou non-réponse dans le délai imparti. Ces 
programmes permettent, entre autres, de ranger les élèves ou les égalités 
d’après le nombre de réussites ou d’après le TR. Mais le traitement le plus im¬ 
médiatement lisible et, surtout, qui tente d’intégrer l’ensemble des mesures et 
des variables, est l’image de la classe ou du groupe. 

Pour construire une image (cf., la figure 2 qui en présente trois), nous 
utilisons la technique de visualisation de l’ensemble Juste-Faux (Fischer, 
1988a). Une case élémentaire correspond à une opération de niveau donné. Si 
un élève, repérable par son numéro, a échoué à plus de 2 vérifications sur les 
14 concernant cette opération et ce niveau, sa case correspondante reste 
blanche; sinon, on calcule son TRu (Temps de Réussite, i.e. un TR limité à des 
réponses correctes) pour les 12 meilleures performances et, suivant le résul¬ 
tat, on lui attribue un niveau de gris (voir légende de la figure 2). Comme le 
noir reflète les meilleures performances, les lignes les plus noircies sont celles 
correspondant aux élèves les plus performants; en conséquence, le progrès de 
la classe ou du groupe se traduit par une image qui se noircit ou, à tout le 
moins, devient plus foncée, au fil des sessions. 


2. ILLUSTRATION DE LA MÉTHODE JUSTE-FAUX 

2.1 Conditions de l'observation 

L’observation rapportée dans cet article utilise une préversion du lo¬ 
giciel Juste-Faux (Fischer, 1988a). Elle concerne une classe de CM2 (5 eme 
année d’école en France) de 25 élèves qui n’a subi aucune modification d’ef¬ 
fectif en cours d’année. L’expérience est intégrée au travail scolaire habituel 
et se fait, bien entendu, en accord et avec la coopération de la maîtresse. 

Le plan d’évaluation consiste en trois mesures recouvrant toute l’an¬ 
née scolaire. Une mesure se fait au cours d’une session, chaque session com¬ 
portant deux passations (voir ci-avant) espacées d’environ une semaine. La 
session 1 s’est déroulée en septembre, une ou deux semaines après la rentrée; 
la session 2, fin janvier, et la session 3, en juin, deux ou trois semaines avant 
les grandes vacances. Le délai de réponse est fixé à 5 secondes. 
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Les élèves ont été informés, en septembre, de l’ensemble du projet et, 
lors de chaque session, et aussi d’une passation à l’autre, l’expérimentateur in¬ 
sistait sur le fait qu’il s’agit certes de répondre vite, mais qu’il faut répondre 
correctement avant tout. Les passations se faisaient en général par groupes de 
6 élèves dans la salle informatique équipée d’un NanoRéseau (Léanord) stan¬ 
dard en présence du seul expérimentateur. 

2.2 Résultats 

Comme annoncé dans la partie 1.1.3, nous avons procédé, pour cette 
classe, à un calcul de la corrélation entre les performances à Juste-Faux et à 
une évaluation scolaire de la maîtrise des opérations arithmétiques des élèves 
au premier semestre. Cette corrélation ne porte que sur 24 élèves car un des 
élèves était absent lors de l’évaluation (écrite et collective) en classe. Elle est 
bonne et significative sans être parfaite : pour la session 1, le coefficient de 
corrélation r est de.49 [t(22) = 2.63, p = .015]; pour la session 2, r = .58 
[t(22) = 3.33; p = .003]. La part de variance des résultats scolaires expliquée 
par la performance à Juste-Faux lors des sessions 1 et 2 est, respectivement, 
de 24% et de 34%. 

La technique de visualisation, décrite de manière générale ci-avant, a 
conduit aux images comparatives de la figure 2. Sur ces images, chaque élève 
repérable par son numéro de 01 à 25, se voit attribuer une ligne en fonction 
de sa performance en septembre, cette ligne étant alors conservée pour les 
deux autres sessions. 

2.3 Discussion 

La visualisation de la figure 2 confirme que les élèves sont loin de con¬ 
naître uniformément et définitivement les faits numériques élémentaires en 
début de CM2 (5 ême et dernière année d’école élémentaire), ni même à la fin. 
Pour les différences entre élèves, les images sont d’une telle netteté qu’elles 
n’ont pas besoin d’être commentées. Pour les différences entre opérations, on 
peut par exemple voir que les soustractions de niveau 1 sont beaucoup moins 
bien maîtrisées que les multiplications de même niveau. 

Par ailleurs, la visualisation donne une impression de progrès, général 
et important dans le sens où il concerne tous les élèves et toutes les opérations 
et niveaux. Elle suggère clairement qu’aucun élève performant en début d’an¬ 
née (haut de l’image de septembre), n’avait atteint un «plafond» l’empêchant 
de progresser par la suite. En outre, on peut remarquer que les 8 élèves du haut 
de l’image de septembre - les seuls à avoir au moins une case gris foncé et moins 
de 3 cases blanches -, se détachent visuellement dès le début de l’année scolaire 
et encore plus nettement à la fin. On peut voir aussi que certains élèves - les nu¬ 
méros 20 et 15 notamment - ont quand même plus progressé que d’autres - les 
numéros 24 et 14 par exemple. Enfin, si on ne se laisse pas trop impressionner 
par le noir dominant de la session de juin, on peut entrevoir un ralentissement 
du progrès dans la deuxième moitié de l’année, peut-être en partie dû à une dé¬ 
mobilisation de certains élèves à la veille des grandes vacances. 
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Figure 2 


Résultats des élèves lors des trois évaluations. 
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Quelle est l’origine de ce progrès massif ? On peut, là aussi, penser à 
un effet «grandes vacances» : la première session s’étant déroulée peu après 
les grandes vacances, il est probable que certains élèves avaient oublié en par¬ 
tie des faits numériques qu’ils connaissaient par coeur avant les vacances. 
Mais, outre cet artefact, l’ampleur du progrès nécessite d’autres explications. 
Les deux principales semblent la maturation et la pratique. Nous ne commen¬ 
terons pas la première, mais nous nous attarderons un peu sur la seconde en 
essayant de préciser la manière dont pourrait s’exercer son influence. 

D’abord, la pratique pourrait conduire à des changements dans les 
stratégies de calcul ou de vérification. Pour la stratégie de vérification, les élè¬ 
ves peuvent, s’ils ont mieux compris l’inversion des opérations, partir du ré¬ 
sultat proposé dans les opérations inverses et vérifier, par exemple, 9+3 = 11 
à la place de 11-3 = 9. La présente observation, contrairement à celle de Fis¬ 
cher (1988b) pour la division, n’étaye guère une telle évolution : les opéra¬ 
tions inverses (divisions et soustractions), qui auraient dû le plus profiter d’un 
tel changement de stratégie, n’ont apparemment pas plus progressé que les 
opérations directes (additions et multiplications). Une explication possible 
est que, dans cette classe, les élèves avaient déjà suffisamment compris l’in¬ 
version opératoire en début d’année pour que l’on n’assiste plus à une évolu¬ 
tion importante en cours d’année. 

Pour la stratégie de calcul, les élèves peuvent soit changer de procé¬ 
dure, soit passer d’une méthode reconstructive s’appuyant sur une mémoire 
procédurale à une méthode reproductive s’appuyant sur une mémoire décla¬ 
rative (cf. Fischer, 1992, pour la distinction procédural/déclaratif). Un chan¬ 
gement de procédure consiste, par exemple, à passer d’un comptage de un en 
un (e.g., pour 9+5, dire 10, 11, 12, 13, 14 , en parcourant parallèlement les 
doigts d’une main) à un passage par 10 plus économique (e.g., pour 9+5, dire 
9+1, 10 , plus 4, 14 ). Un changement de méthode consiste à passer d’une mé¬ 
thode procédurale, comme celles que nous venons de décrire, à une méthode 
déclarative, i.e. à une récupération en mémoire à long terme déclarative d’une 
unité - phrase, proposition ou image - notée {+, 9, 5,14} dans Fischer (1992). 
Par exemple, dans la présente observation, l’égalité 9x3 = 27 est celle qui a le 
plus gagné en vitesse en cours d’année. On peut donc penser qu’elle a été re¬ 
construite, par additions successives ou en parcourant le début de la table de 
7, en début d’année (juste après les vacances !) par certains élèves, alors qu’el¬ 
le était connue par coeur par quasiment tous les élèves en fin d’année scolaire. 

2.4 Conclusions 

D’abord, nous aimerions suggérer un élément de réponse à une ques¬ 
tion que soulève cette observation : Comment des élèves, qui semblent con¬ 
naître par coeur des faits numériques rudimentaires comme 4+2 = 6, 2+3 = 5, 
4x2 = 8, ... dès la fin de la première ou deuxième année d’école, peuvent-ils 
encore progresser aussi nettement (et plus que ce que semblent expliquer de 
simples facteurs maturationnels) ? Nous suggérons que l’évaluation scolaire 
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«classique» n’est pas assez précise et rigoureuse pour repérer tous les élèves 
qui ne connaissent pas les faits élémentaires par coeur. En particulier, le délai 
de réponse n’est pas contrôlé de manière rigoureuse, et le TR n’est quasiment 
jamais mesuré. Une illustration de ce constat est constituée, dans la présente 
observation, par l’élève n° 15 sur la visualisation de la figure 2, première de la 
classe y compris en mathématiques, qui connaissait très peu de faits par coeur 
et n’avait pas été repérée par la maîtresse : dans toutes les évaluations scolai¬ 
res, elle avait probablement le temps et la capacité de reconstruire le résultat ! 

Ensuite, nous conclurons cette partie en soulignant, par référence à 
Ehrlich et Florin (1989), que la méthode Juste-Faux semble remplir deux 
fonctions : 

1. elle permet aux élèves de «voir» leurs progrès et, en conséquence, 
de les inciter à en faire, à l’image des grands champions qui «ne pen¬ 
sent pas qu’ils vont devenir les meilleurs tout de suite; ils s’entraînent 
beaucoup, tous les jours. Ce qui les intéresse c’est de voir qu’ils pro¬ 
gressent, qu’ils font mieux chaque semaine que la semaine précé¬ 
dente » (p.45). 

2. elle permet aux enseignants un diagnostic rapide, précis et peu coû¬ 
teux, évitant ainsi «que le maître passe tout un temps (quelques 
mois) à bien comprendre comment fonctionne chaque enfant; puis à 
repérer ultérieurement tous les changements qui interviennent dans 
ce fonctionnement » (ibid., p.47). 

3. APPLICATIONS DE LA MÉTHODE DES TR 

3.1 A l'élaboration d'un modèle 
du développement numérique 

Une autre préversion du logiciel Juste-Faux, que nous avons utilisée 
sur 210 élèves en fin d’école élémentaire (dernier trimestre du CM2), a con¬ 
duit à deux observations intéressantes. 

1. Les quatres opérations sont loin d’être uniformément connues : ce 
sont surtout les opérations additives qui conduisent à des performan¬ 
ces (réussites et TR) médiocres (Fischer, 1987). Par exemple, une 
«égalité» comme 11-3= 9 n’a été réussie que par 54,3% des élèves (à 
peine plus que le hasard), avec un TRu « 2,71 s; ou encore, 9+7 = 15 
a conduit à 59,5% de réussite, avec un TRu= 2,69 s. Si l’on ajoute 
qu’une égalité comme 5x2 = 10 a conduit à 93,3% de réussite, avec 
un TRu deux fois moindre, on voit bien qu’il existe une différence de 
difficulté considérable entre des égalités toutes qualifiées d’élémen¬ 
taires. En outre, on peut noter que les élèves présentant un retard 
scolaire (quelle qu’en soit l’origine) se sont révélés, électivement, en 
difficulté sur une égalité comme 9+7 = 15 : ils ont non seulement été 
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plus lents, mais surtout leur pourcentage de réussite n’a été que de 
39% (contre 68% pour les autres élèves). 

2. Les soustractions s’opposent aux multiplications sur un axe procédu¬ 
ral / déclaratif dégagé par l’Analyse Factorielle des Correspondances 
(AFC) de Fischer et Pluvinage (1988; voir figure 3). Il est probable 
que les premières conduisent très souvent à une reconstruction du 
résultat, grâce à une procédure stockée en mémoire procédurale, 
alors que les secondes conduisent davantage à une récupération du 
résultat en mémoire déclarative. Autrement dit, les élèves savent 
seulement comment on fait pour trouver 11-3, alors que, pour 5x2 
(ou, plus typiquement, pour 7x7) ils savent que c’est 10 (ou 49). 


axe 2 



Situation des quatres opérations sur les axes compréhension et exécution. 


En considérant alors les soustractions comme le prototype des 
connaissances procédurales, et les multiplications comme celui des connais¬ 
sances déclaratives, nous avons pu émettre plusieurs hypothèses, non trivia¬ 
les, qui se sont confirmées (Fischer, 1992). Les connaissances procédurales 
sont plus sensibles à l’amorçage (indirect) que les connaissances déclaratives. 
En revanche, ce sont les connaissances déclaratives qui sont le plus sensibles 
à l’effet de positivité : la supériorité des égalités positives ou justes (e.g., 7x7 
= 49) sur les égalités fausses (e.g., 7x7 = 42) est plus accusée pour la multi¬ 
plication que pour la soustraction. 
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Mais cette distinction entre connaissances procédurales et déclarati¬ 
ves, pour fondamentale qu’elle soit, n’est peut être pas l’aspect développe- 
mentalement le plus intéressant du modèle PDup (Procédural-Déclaratif- 
unitisation-procéduralisation) que nous avons élaboré. En effet, comme le 
suggère le sigle PDup, nous postulons aussi l’existence de deux mécanismes 
d’échange et d’interaction entre ces deux types de connaissance. L’unitisa¬ 
tion permet de former de nouvelles unités en mémoire déclarative, directe¬ 
ment ou à partir de la mise en oeuvre de connaissances procédurales. Par 
exemple, l’élève qui trouve 7+3 grâce à la procédure de surcomptage (8, 9, 
10 ), peut ensuite former une unité, notée {+,7,3,10}, qui associe les données 
et le résultat. La procéduraJisation, quant à elle, permet l’inclusion de con¬ 
naissances déclaratives dans des procédures. En prolongeant l’exemple pré¬ 
cédent, le même élève pourra alors inclure cette unité dans une procédure de 
«passage de la dizaine», comme 7+5 = 10+2 = 12. Notons d’ailleurs que cette 
dernière procédure inclut non seulement l’unité {+,7,3,10}, mais aussi, subsé¬ 
quemment, l’unité {+,3,2,5}. 

Enfin, un autre aspect pédagogiquement intéressant du modèle, est 
qu’il superpose deux formes d’apprentissage aux deux formes de connaissan¬ 
ces ou de mémoires. L’apprentissage déclaratif est direct et abrupt : nous 
pouvons encoder presque instantanément une nouvelle unité. Néanmoins, 
une nouvelle unité, pour subsister à long terme, devra être consolidée. L’ap¬ 
prentissage procédural est, en revanche, plutôt lent et graduel. Il est le fruit 
de l’exercice : on apprend en faisant pour reprendre la formule d’Anderson 
(1983). Avec l’exercice, les procédures peuvent s’automatiser. Nous avons 
ainsi une distinction, théoriquement fondée, entre deux mécanismes souvent 
présents dans le discours pédagogique mais rarement bien différenciés : la 
consolidation et l’automatisation. 

3.2 A l'étude des différences individuelles 

Widaman, Little, Geary et Cormier (1992) ont étudié transversale¬ 
ment le développement de l’addition mentale. Leur étude 1 a porté sur 123 
élèves de 2ème, 4ème et 6ème années ayant répondu à 140 additions dans une 
tâche de vérification; en outre, 8 scores à des subtests du SAT (Stanford 
Achievement Test) sont aussi disponibles pour ces élèves. Leur étude 2 a por¬ 
té sur 163 étudiants de 2ème, 4ème, 6ème année et du collège (19.8 ans en 
moyenne) soumis à des additions mentales simples (80) et complexes (80); 
en outre, ils ont aussi été soumis à des tests de facilité numérique et de vitesse 
de perception. 

Les auteurs arrivent à plusieurs conclusions : 

- il y a des différences individuelles substantielles pour l’âge où se pro¬ 
duit la transition du comptage vers la récupération : alors qu’une large 
proportion d’élèves de 2ème année a déjà recours à la récupération 
pour répondre aux additions, une importante minorité d’élèves de 
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6ème année, et même d’étudiants de collège, a toujours recours à des 
processus de comptage; 

- le degré d’automatisation des différents processus qui sous-tendent 
l’addition mentale (encodage des chiffres, recalcul ou récupération de 
la somme correcte, retenue à reporter dans la colonne suivante) n’est 
pas le même pour tous; 

- si l’on prend pour indice la vitesse de récupération pour les sujets ré¬ 
cupérant les faits et la vitesse d’incrémentation pour ceux qui les 
comptent, les différences individuelles dans l’addition sont fortement 
reliées aux mesures de niveau et de capacité. 

Si ces conclusions, notamment la dernière, confirment donc l’intérêt 
de la mesure des TR et lui confèrent en outre une validité externe, en revan¬ 
che les enseignants ne trouveront rien de révolutionnaire dans les 
«implications éducatives» que Widaman et Little (1992, pp.247-8) essaient de 
tirer de cette recherche (entre autres). En effet, Widaman et Little 
soulignent : (1) que l’influence de l’éducation sur les additions élémentaires 
se fait surtout sentir dans les premières années; (2) qu’il faudrait ajuster l’en¬ 
seignement de chaque problème aux capacités de l’enfant individuel; (3) que 
le niveau scolaire est un meilleur indice que l’âge chronologique pour mesurer 
le développement des additions. Tout ceci est presque évident, ou pour le (2), 
contenu, au moins implicitement, dans les grandes théories de l’apprentissa¬ 
ge, en tout cas dans celles que nous avons exposées dans un document récent 
(Fischer, 1993b). 

3.3 À l'étude de groupes particuliers d'élèves 

3 . 3.1 L'étude des sujets MD 

Geary, Brown et Samaranayake (1991) ont entrepris une étude longi¬ 
tudinale sur 26 sujets normaux et 12 sujets Mathematically Disabled (MD) 
de 1ère et 2ème année d’école. Au moment de la 1ère mesure, les élèves ont 
eu à calculer 40 additions simples extraites des 56 que l’on obtient en enlevant 
les 0, 1 et doubles. Dix mois après, la tâche d’addition a été administrée une 
seconde fois. La tâche des élèves est ici une tâche de production. 

Chez les élèves normaux, Geary et al. observent un recours plus im¬ 
portant à la récupération et moins important au comptage, aussi bien qu’une 
amélioration des vitesses de comptage et de récupération. En revanche, chez 
les élèves MD aucun changement fiable dans le mixage des stratégies ou dans 
la vitesse d’exécution du comptage et des récupérations en mémoire n’a été 
observé. De manière précise, d’une session à l’autre, l’utilisation du comptage 
a baissé de 23 % et celle de la récupération a augmenté de 12% chez les Nor¬ 
maux, alors que chez les MD on observe une certaine stabilité, voire un pat¬ 
tern évolutif inverse : le comptage a augmenté de 6%, alors que la 
récupération a baissé de 1%. 
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A partir de l’observation de Geary et al. (1991), et aussi par référence 
à Howell, Sidorenko et Jurica (1987) qui ont montré (pas trop scientifiquement 
à notre avis) qu’un apprentissage sévère ( drill ) et extensif de faits de base 
n’améliore pas la récupération, Geary (1993) suggère l’existence de deux défi¬ 
cits fonctionnels distincts. Ces deux déficits semblent suivre des trajectoires 
développementales différentes. Le premier déficit, l’utilisation de procédures 
arithmétiques développementalement immatures et une grande fréquence 
d’erreurs procédurales, semble médiatisé par un retard développemental dans 
l’acquisition de connaissances conceptuelles qui sous-tendent l’utilisation des 
procédures. Le second déficit implique une difficulté plus fondamentale, i.e. 
qui ne disparaît pas avec le développement, dans la représentation et la récu¬ 
pération de faits arithmétiques de la mémoire à long terme sémantique (ou dé¬ 
clarative comme nous préférons dire). En se basant sur des études 
comparatives de jumeaux homozygotes et dizygotes, Geary suggère même que 
ce deuxième déficit pourrait être davantage héréditaire que le premier. 

3 . 3.2 Les sujets Hyper Actifs 

Zentall et Smith (1993), après Zentall (1990) qui avait étudié des su¬ 
jets LD ( Leaming Disabledj et avec déficits attentionnels (ADD : Attention 
Déficit Disorderj, ont étudié 57 garçons sans désordre, 22 HyperActifs (HA) 
non agressifs et 13 HA agressifs. Les opérations arithmétiques étudiées, sur 
des nombres à 1 chiffre seulement, sont : l’addition, la soustraction et la mul¬ 
tiplication, avec la particularité que la soustraction peut être posée dans l’en¬ 
semble Z des relatifs (e.g., «2 - 7 = »). 

La tâche est une tâche de production : les élèves doivent taper les ré¬ 
ponses au clavier, aussi vite que possible, et appuyer sur Entrée à la fin, cette 
dernière frappe arrêtant le chrono. Les auteurs ont essayé de contrôler le fac¬ 
teur vitesse de frappe en introduisant préalablement une tâche de recopie 
d’assemblages du type «- 8 = » qui a une fonction à la fois d’entraînement et 
de mesure de la seule vitesse de frappe. 

Bien que cette recherche soulève certains problèmes méthodologi¬ 
ques - notamment la pratique curieuse de la soustraction avec des élèves re¬ 
crutés de la 2ème à la 5ème année d’école - on ne peut manquer de noter que 
les auteurs soulignent fortement l’intérêt et la pertinence de la mesure des vi¬ 
tesses de l’addition. Par exemple, dès l’introduction, ils soulignent : 

- que Zentall (1990) a montré que la vitesse de calcul des additions et 
des soustractions est inférieure à celle des normaux chez les sujets LD 
et chez les sujets ADD ; 

- la valeur heuristique des facteurs sous-tendant la vitesse de réponse 
en maths : la vitesse des calculs simples s’est en effet avérée le 
meilleur prédicteur de la reconnaissance en lecture et de la résolution 
de problèmes. 
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Puis, en conclusion de leurs observations et de celles antérieures avec 
des sujets souffrant de désordres plus sévères (Zentall, 1990), ils remarquent 
que : 

- la vitesse plus lente de l’addition pourrait être un marqueur d’une in¬ 
fériorité des performances en addition, et des performances scolaires 
plus généralement, chez les jeunes souffrant d’une hyperactivité ac¬ 
compagnée d’agressivité; 

- la vitesse de réponse aux faits d’addition pourrait être une meilleure 
mesure que beaucoup de tâches de laboratoire ou de tests normatifs. 

Enfin, dans l’abstract, ils écrivent que «les conclusions dérivées à par¬ 
tir de ces découvertes, et de travaux antérieurs, indiquent que la vitesse de 
l’addition pourrait être un marqueur de dysfonctionnement scolaire et social». 


Conclusion 

Dans cet article, nous avons envisagé un problème méthodologique 
majeur posé par la mesure des TR en situation scolaire (partie 1.1). Nous 
avons expliqué comment la méthode Juste-Faux tente de le surmonter (partie 
1.2). Cette dernière a conduit à de nombreuses observations semblables à cel¬ 
le rapportée dans la partie 2. L’observation précise rapportée nous a alors per¬ 
mis de montrer l’utilisation pédagogique de la méthode, notamment à des fins 
d’évaluation diagnostique. Enfin, à propos de la méthode des TR plus généra¬ 
lement, nous avons rapporté les grands traits du modèle de développement 
numérique qu’elle nous a permis de mettre au point (partie 3.1), ainsi que des 
applications récentes à l’étude des différences individuelles (partie 3.2) et à 
celle de groupes (MD ou HA) particuliers (partie 3.3). 

Dans l’ensemble, ces applications récentes ont confirmé - parfois net¬ 
tement (voir Zentall et al. ci-avant) l’intérêt diagnostique, à des fins de carac¬ 
térisation ou de différenciation, de la mesure des TR à des faits numériques 
élémentaires. 

Nous conclurons (évidemment !) de manière au moins aussi positive 
quant à l’application de la méthode Juste-Faux. Nous ne reviendrons pas sur 
les intérêts de la méthode, que nous avons dégagés dans les parties 2.3 et 2.4. 
Nous soulignerons cependant encore, à propos du modèle PDup qu’elle nous 
a permis d’élaborer (cf. la partie 3.1), que ce modèle prend une nouvelle di¬ 
mension au moment où certains élèves de Piaget (e.g., Mounoud, 1994) pos¬ 
tulent que c’est l’existence simultanée de deux systèmes de connaissances en 
parallèle qui constituerait la dynamique du développement. En effet, et en ac¬ 
cord avec Mounoud, nous débouchons alors sur la conclusion générale que le 
moteur du développement, selon la célèbre formule de Piaget, ne serait pas 
l’action comme il l’avait soutenu mais les rapports dialectiques qui s’instaurent 
entre deux systèmes de connaissances. 
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Mais tous ces intérêts de la méthode Juste-Faux, et des autres mesu¬ 
res analogues des TR aux faits numériques élémentaires, ne manquent pas de 
soulever une question intrigante à laquelle nous tenterons de répondre en 
cette fin d’article : pourquoi une telle évaluation ne s’est-elle pas (encore ?) 
imposée dans les classes ? 

Nous passerons sur les problèmes pratiques bien qu’ils jouent vrai¬ 
semblablement un rôle majeur. Nous insisterons davantage sur deux autres 
raisons. 


La première est d’ordre institutionnel. Dans les programmes officiels 
français Çcf., MEN, 1991), on demande une mémorisation de la table d’addi¬ 
tion en 1ère année d’école (Cours Préparatoire) et de celle de multiplication 
en 2 eme et 3 eme année (Cours Elémentaire). Mais on se garde bien de préci¬ 
ser les critères d’une telle mémorisation. En effet, si l’on voulait préciser ces 
critères, on serait vraisemblablement obligé d’introduire, d’une manière ou 
d’une autre, les TR. 

La seconde, qui est en partie à la fois une cause et une conséquence 
de la première, est que la distinction entre une connaissance déclarative vs 
procédurale, quels que soient les qualificatifs utilisés (e.g., récupération vs 
reconstruction), est loin de s’être imposée, pour les tables élémentaires, à 
tous les esprits. On pense encore trop souvent, et le rappel des programmes 
ci-avant l’illustre bien, que les tables sont mémorisées précocement, unifor¬ 
mément et définitivement par les élèves. Toutes nos observations expérimen¬ 
tales et analyses montrent qu’il n’en est rien (voir, par exemple, Fischer, 
1987; voir aussi la partie 2.3). D’où vient alors cette fausse idée ? Nous l’ex¬ 
pliquons par le fait que dans les recherches psychologiques on n’interroge 
souvent que des sujets étudiants, volontaires, répondant plusieurs milliers de 
fois à des additions élémentaires, ... ; on arrive alors à un résultat - les sujets 
récupèrent les faits arithmétiques dans un réseau ou une table - dont la vali¬ 
dité écologique est douteuse. En outre, et en complément, les deux modèles 
basés sur l’observation de jeunes élèves les plus influents ont, trop lourde¬ 
ment nous semble-t-il, insisté sur la récupération en mémoire, au détriment 
d’autres stratégies (e.g., le calcul réfléchi : cf. Brissiaud, Clerc & Ouzoulias, 
1992) : Ashcraft (1982) en suggérant que c’est vers la fin de la troisième an¬ 
née d’école que les enfants passent d’une méthode algorithmique (e.g., le 
comptage) à une récupération en mémoire déclarative; Siegler & Shrager 
(1984) en donnant la priorité à la récupération en mémoire dans leur modèle 
initial de choix de stratégie. D’ailleurs, pour étayer ce dernier point de vue, 
nous terminerons en citant une recherche récente de Geary, Frensch et Wiley 
(1993). Ces derniers semblent considérer comme une «découverte» - en tout 
cas ils la mettent en valeur dans leur conclusion - l’observation que tous les 
étudiants universitaires gradés ne sont pas versés en arithmétique. De manière 
précise, leur étude sur la soustraction, jointe à celle semblable sur l’addition de 
Geaiy et Wiley (1991), suggèrent que moins de la moitié des étudiants semble 
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maîtriser l’arithmétique de base si on la définit comme une récupération auto¬ 
matique en mémoire à long terme des faits de base et des faits «en colonne» 1 
(e.g.,32-9). 


1 Récupérer des faits «en colonne» en mémoire à long terme c’est appliquer la technique opé¬ 
ratoire de l’opération posée en recourant aux faits de base. 
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Introduction 

Proposer une évaluation-diagnostic des apprentissages, c’est propo¬ 
ser une évaluation qui permette de déterminer l’origine d’une (ou de plu¬ 
sieurs) difficulté(s) observée(s) dans un domaine considéré. Ainsi, en lecture, 
l’évaluation-diagnostic doit être capable non pas de donner simplement une 
estimation du niveau d’habileté d’un lecteur en terme de vitesse de lecture et/ 
ou de compréhension (ce que font généralement les tests de lecture), mais 
d’identifier l’origine d’une éventuelle inefficience, en indiquant le plus préci¬ 
sément possible le niveau de performance d’une personne pour les différents 
processus qui permettent à la lecture de bien se dérouler (Jourdain, 1989; 
Seymour, 1986; Zagar, 1992b). En 1990, la région Bourgogne, dans le cadre de 
la lutte contre l’illettrisme et d’un contrat de plan avec l’Etat, nous accordait 
un financement pour mettre au point une évaluation de ce type pour le lecteur 
adulte. En construisant le logiciel d’évaluation-diagnostic des Capacités Co¬ 
gnitives du Lecteur Adulte (Zagar, Jourdain & Lété, 1993; Zagar, Jourdain & 
Lété, à paraître), notre objectif était donc de créer un logiciel qui donne des 
indications sur les capacités cognitives qui sous-tendent l’activité du lecteur 
et sur leur niveau de fonctionnement. 

Pour mener à bien un tel projet, il est nécessaire d’une part de béné¬ 
ficier d’un cadre théorique de référence qui permette de faire le point sur les 
différentes capacités impliquées en lecture. Ce cadre nous est fourni par les 
travaux en psycholinguistique et fera l’objet de la première partie de cet ex¬ 
posé. D’autre part, il faut proposer des épreuves adaptées à l’évaluation du 
fonctionnement des différents processus impliqués en lecture et préalable¬ 
ment définis. Là encore, les travaux en psycholinguistique permettent de ré¬ 
soudre un certain nombre de problèmes, ce qui fera l’objet d’une seconde 
partie. Enfin, dans une dernière partie nous présenterons les résultats de 
l’étalonnage auquel nous avons procédé auprès de 160 adultes, en montrant 
plus particulièrement quelles sont les différences observables entre des lec¬ 
teurs plus ou moins efficients. 

1. CADRE THÉORIQUE 


Depuis les années soixante, la lecture est considérée comme un en¬ 
semble d’étapes de traitement de l’information. Si les modélisations varient 
d’un auteur à l’autre (pour une revue cf. Zagar, 1992a), il existe néanmoins un 
certain nombre de points communs : au départ, l’information est extraite de 
la page; à la fin, cette information est intégrée à l’ensemble de nos connaissan¬ 
ces et permet l’élaboration d’une représentation mentale du texte. La figure 1 
présente une illustration des étapes qui permettent cette élaboration. Globa¬ 
lement, on peut distinguer trois étapes nécessaires à la compréhension d’un 
texte : la reconnaissance des mots (niveaux 1 et 2 sur le modèle), l’analyse 
syntaxique (niveau 3) et l’analyse sémantique (niveau 4). 
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1.1 La reconnaissance des mots 

Reconnaître un mot c’est mettre en correspondance un signal visuel 
(le mot écrit) et une représentation interne de ce signal. Les psycholinguistes 
font l’hypothèse que ces représentations internes sont stockées au sein d’une 
sorte de dictionnaire : le lexique mental, qui se construit progressivement au 
cours de l’apprentissage de la langue. Cependant cet appariement entre signal 
visuel et représentation interne ne s’effectue pas de façon directe. 

En premier lieu (niveau 1 sur la Figure 1) interviennent les processus 
d’extraction des informations contenues dans la page, parmi lesquels il faut 
ranger les traitements perceptifs, notamment la reconnaissance des lettres et 
l’analyse de la chaîne de caractères (i.e. le codage des lettres en fonction de 
leur position; Ellis & Young, 1990). A ce niveau, les lettres vont activer des co¬ 
des internes : les codes graphémiques (Bigsby, 1988; Coltheart, 1981; Evett & 
Humphreys, 1981). 

Une fois ces codes graphémiques activés, il existerait deux façons 
d’activer une entrée lexicale (i.e. la représentation interne d’un mot; Col¬ 
theart, 1978). 



Figure 1 

Modélisation des étapes de traitement de l'information impliquées pendant la 
lecture 
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La première (2a sur la figure 1) consiste en l’appariement direct des 
codes graphémiques avec les codes stockés au sein du lexique mental : on par¬ 
le alors de voie directe ou d’adressage (Forster, 1976; McClelland & Rumel- 
hart, 1981). 

La seconde (2b sur la figure 1) consiste, à partir des codes graphémi¬ 
ques, en l’activation de codes phonémiques (par l’intermédiaire d’une procé¬ 
dure mettant en oeuvre des règles de correspondance entre graphème et 
phonème) et en l’assemblage de ces codes phonémiques. Dans ce cas, la re¬ 
connaissance du mot s’effectue par appariement de cette représentation pho¬ 
nologique assemblée avec une représentation phonologique contenue dans le 
lexique mental (Segui, 1991). On parle ici de voie indirecte ou d’assemblage. 
Cette voie joue sans doute un rôle important lors de l’apprentissage de la lec¬ 
ture, en permettant à l'enfant d’associer des représentations graphiques, nou¬ 
velles pour lui, à des représentations auditives familières (Barron, 1986; 
McCusker, Hillinger & Bias, 1981; Meyer, Schvaneveldt & Ruddy, 1974; Stano- 
vich, 1982). 

1.2 L'analyse syntaxique (niveau 3) 

Pour comprendre un texte, le lecteur doit non seulement identifier les 
mots mais aussi déterminer quelles sont les relations qu’ils entretiennent en¬ 
tre eux (Mitchell, 1987). Autrement dit, il s’agit d’articuler les items lexicaux 
entre eux, de repérer leur rôle fonctionnel : sujet, verbe,..., de les associer en 
unités de plus haut niveau : syntagme, proposition,...(Zagar, 1992a). 

1.3 L'analyse sémantique (niveau 4) 

Une fois la structure de la phrase établie, le lecteur procède au calcul 
de la signification, i.e. à l’intégration des informations au reste du texte. Il va 
également intégrer ces informations à l’ensemble de ses connaissances et cela 
en fonction de ses connaissances préalables. 

Si la finalité de toute lecture est de comprendre, l’activité de lecture, 
comme l’indique la Figure 1, ne peut se résumer à la compréhension. Par con¬ 
séquent, on peut logiquement envisager que chacun des processus impliqués 
dans la lecture puisse être responsable ou à l’origine d’une dif fi culté en lectu¬ 
re. Cependant, du point de vue du fonctionnement, ces processus ne sont pas 
équivalents puisqu’ils nécessitent plus ou moins de ressources attentionnel- 
les. En effet, compte tenu, d’une part, de la rapidité avec laquelle le lecteur 
expert effectue l’ensemble des opérations qui mènent à la compréhension (la 
vitesse moyenne de lecture varie entre 240 et 400 mots/minute selon le type 
de texte; Rayner & Pollatsek, 1987), compte tenu, d’autre part, du fait que les 
ressources attentionnelles dont dispose le système de traitement sont limitées 
(Kahneman, 1973), il faut envisager qu’un certain nombre d’opérations sont 
automatisées (Laberge & Samuels, 1974). 
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Le paradigme de Stroop (1935) a permis de mettre en évidence le ca¬ 
ractère automatique (i.e. irrépressible) de la reconnaissance des mots. Lors¬ 
que l’on présente à une personne une planche sur laquelle sont inscrits des 
noms de couleurs (rouge, bleu, vert,...) dans des encres de couleur différente 
(par exemple, rouge écrit en bleu...) et qu’on lui demande de nommer la cou¬ 
leur de l’encre des mots, on observe (par rapport à la tâche de dénomination 
des mots) un ralentissement au niveau de la vitesse de prononciation, des hé¬ 
sitations et parfois des erreurs. Tout se passe comme si la personne ne pouvait 
s’empêcher de lire le mot, comme si la réponse au mot s’imposait face à la ré¬ 
ponse à la couleur. 

Chez le lecteur expert, l’ensemble des opérations menant à la recon¬ 
naissance des mots serait donc automatisé, permettant ainsi d’allouer les res¬ 
sources attentionnelles aux processus de haut niveau (étapes chargées du 
calcul du sens). A l’opposé, le lecteur débutant mobiliserait ses ressources at¬ 
tentionnelles vers les premières étapes du traitement, ce qui entraverait le 
processus de compréhension. De fait, on a pu montrer que l’habileté à décoder 
les mots explique en grande partie le niveau de compétence en lecture 
(Schvaneveldt, Ackerman & Semlear, 1977; Stanovich, 1982, 1986). Par 
ailleurs, dans la majorité des cas, il semble que les difficultés de lecture pro¬ 
viennent d’un déficit au niveau des processus menant à la reconnaissance des 
mots (cf. les travaux sur les dyslexies développementale et acquise), notam¬ 
ment par un défaut d’automatisation (ou une détérioration dans le cas des 
dyslexies acquises) des processus menant à cette reconnaissance (Bruck, 
1990; Stanovich, 1982; Vellutino, 1979). Par ailleurs, ces processus sont spé¬ 
cifiques à la lecture contrairement aux processus de compréhension qui sont 
impliqués dans d’autres tâches cognitives (compréhension du langage parlé). 
C’est pourquoi ECCLA propose essentiellement une évaluation-diagnostic des 
processus qui conduisent à la reconnaissance des mots. Ces processus ont été 
regroupés en étape de traitement visuel (i.e. activation des codes graphémi- 
ques et analyse de la chaîne de caractères), étape de traitement phonologique 
(i.e. activation des codes phonémiques, assemblage et activation des entrées 
lexicales par les codes phonologiques), et étape lexicale (i.e. activation direc¬ 
te des entrées lexicales et activation des concepts au sein du lexique). 

2. TECHNIQUES, MATÉRIEL ET ÉTALONNAGE 

Une fois définies les différentes étapes impliquées dans la compréhen¬ 
sion d’un texte, se pose le problème des techniques qui permettent d’évaluer 
le fonctionnement de chacune de ces étapes de traitement. Si l’on y réfléchit, 
on s’aperçoit que l’acte de lecture ne donne lieu à presqu’aucun comporte¬ 
ment observable (en dehors de celui de l’activité oculaire et de la lecture à 
voix haute). Les psycholinguistes ont mis au point des techniques expérimen¬ 
tales susceptibles de révéler l’activité de processus mentaux parfaitement 
inobservables en situation naturelle (pour une revue cf., par exemple, Rayner 
& Pollatsek, 1989). La plupart de ces techniques utilise le temps nécessaire à 
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l’accomplissement d’une tâche simple comme indicateur du fonctionnement 
d’une étape de traitement (Sternberg, 1969). Le principe est que les étapes de 
traitement sont consommatrices de temps et que tout dysfonctionnement de¬ 
vrait se traduire par un ralentissement des processus engagés. Autrement dit, 
plus le traitement est automatisé, plus la réponse est rapide. 

2.1 Techniques 

On peut distinguer deux types de mesures chronométriques utilisées 
en recherche fondamentale : les techniques dites à temps de réaction et celles 
dites à temps libre (Zagar, 1992a). 

Les techniques à temps de réaction consistent à demander au sujet 
d’effectuer le plus rapidement et le plus précisément possible une tâche sim¬ 
ple. Par exemple, dans le cas d’une décision lexicale, la personne devra déci¬ 
der si la suite de lettres qui apparaît à l’écran est ou n’est pas un mot de la 
langue française. Le temps de réaction (TR) correspond à l’intervalle de 
temps entre l’apparition à l’écran de la suite de lettres et le moment où le sujet 
donne sa réponse (en appuyant sur une touche déterminée du clavier). Ce 
temps de réaction est supposé refléter la vitesse à laquelle la reconnaissance 
du mot est effectuée et donc les processus cognitifs qui conduisent à cette re¬ 
connaissance. Outre le fait qu’en soi un TR est déjà un indicateur du traite¬ 
ment cognitif effectué par le sujet, on peut également manipuler différentes 
caractéristiques du matériel (longueur de la chaîne de caractères, fréquence 
des mots,...) et donc comparer la façon dont s’effectuent les traitements. 

Les techniques à temps libre consistent à mesurer de façon continue 
le temps que met un lecteur pour lire chaque segment (mot, syntagme,...) 
d’un texte. Par exemple, le paradigme APS II (Auto-Présentation Segmentée 
version 2; Lété, Zagar & Pynte, 1994) permet au lecteur de commander l’ap¬ 
parition de chaque mot du texte à l’écran. Pour faire apparaître le mot, le lec¬ 
teur utilise une touche du clavier : l’appui de cette touche provoque 
l’apparition du mot à l’écran, le lâcher sa disparition, il faut appuyer de nou¬ 
veau pour faire apparaître le mot suivant. Pour chaque mot, nous disposons 
donc d’un temps de lecture (en millisecondes) décomposable en un temps 
d’appui (temps pendant lequel le mot reste affiché à l’écran et qui reflète, se¬ 
lon les auteurs, au moins, les processus d’extraction de l’information) et un 
temps de lâcher (temps pendant lequel l’écran reste vide) et qui reflète les 
processus subséquents à l’accès au lexique. 

Les épreuves utilisées pour l’évaluation-diagnostic des processus me¬ 
nant à la reconnaissance des mots vont donc s’appuyer sur le recueil de telles 
mesures chronométriques. 



Évaluer les difficultés de lecture chez l'adulte 107 


2.2 Matériel 1 

Il est constitué de trois ensembles d’épreuves : 

1. dix épreuves à temps de réaction visant à évaluer le fonctionnement 
des étapes (visuelle, phonologique -indirecte- et lexicale -directe) 
menant à la reconnaissance des mots, auxquelles nous avons ajouté; 

2. deux épreuves sur un matériel non linguistique, comprenant deux 
tâches à temps de réaction qui déterminent la vitesse de réaction du 
sujet; 

3. deux épreuves de lecture en APS II (technique à temps libre). 

2.2.1 Les épreuves testant l'analyse visuelle 

Nous avons sélectionné quatre épreuves pour estimer l’activation des 
codes graphémiques et l’analyse d’une chaîne de caractères. 

Codage abstrait des lettres (Posner & Mitchell, 1967). Dans cette 
épreuve, le sujet doit décider si les deux lettres présentées simultanément à 
l’écran sont identiques indépendamment de la façon dont elles sont typogra- 
phiées (deux majuscules -AA-, deux minuscules -a a- ou une majuscule et une 
minuscule -A a). Les lettres ne sont pas réversibles (p/q), la lettre écrite en 
majuscule a une forme différente de la lettre écrite en minuscule (A/a et non 
C/c). Pour les réponses négatives (c X) les deux lettres ont été choisies de fa¬ 
çon à ce qu’elles soient rarement confondues (moins de 1% d’erreur selon la 
matrice de confusion de Paap, Newsome, McDonald & Schvaneveldt, 1982). 
Après 12 items d’entraînement, le sujet doit effectuer cette décision pour 36 
items expérimentaux présentés chacun deux fois et répartis en 6 blocs. 

Jugement d’identité de lettres (Seymour, 1986). On demande au sujet 
de déterminer si une suite de lettres est constituée uniquement par la même 
lettre (par exemple : CCCYCCC, réponse négative, vs CCCCCCC, réponse po¬ 
sitive). Les suites sont de 3, 7 ou 11 lettres majuscules. Dans le cas où une 
autre lettre est présente, celle-ci peut être soit très différente (CY ou MB) soit 
très proche (KX ou PR) selon la matrice de confusion de Paap et al. (1982). 
Cette épreuve comporte 24 items d’entraînement répartis en 2 séries et 72 
items expérimentaux répartis en 6 séries. 

Jugement de similitude de 2 ensembles non-prononçables de lettres 
(Seymour, 1986). On présente simultanément l’une à côté de l’autre deux sui¬ 
tes de 5 consonnes en majuscule. Le sujet doit déterminer si les deux suites 
sont identiques. Les suites diffèrent par le nombre de lettres modifiées (une, 
BRTQP BLTQP, vs toutes, BRTQP CSLMN), par le type de modification ap¬ 
portée (substitution d’une lettre, BRTQP BLTQP, ou inversion de deux let¬ 
tres, BRTQP BTRQP) ainsi que par la position de la modification apportée (de 
la première à la cinquième lettre). Dans le cas d’une modification portant sur 
une seule lettre, cette lettre est remplacée par une lettre donnant lieu à peu 


1 Annexe 1 pour une synthèse des épreuves et des exemples. 
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de confusion (Paap & al., 1982). Le sujet dispose de 22 items d’entraînement 
répartis en 2 blocs et de 88 items expérimentaux répartis en 8 blocs. 

Jugement de similitude de 2 ensembles prononçables de lettres (Sey¬ 
mour, 1986). On présente simultanément l’une à côté de l’autre deux suites de 
5 lettres en majuscule. Le sujet doit déterminer si les deux suites sont identi¬ 
ques. Les suites diffèrent par le nombre de lettres substituées (une, CABOL 
CATOL, vs toutes, CABOL DUFIS) et par la position de la lettre remplacée (de 
la première à la cinquième lettre). Le suj et dispose de 16 items d’entraînement 
répartis en 2 blocs et de 48 items expérimentaux répartis en 6 blocs. 

2 . 2.2 Les épreuves testant l'analyse phonologique 

Trois épreuves permettent de tester l’activation des codes phonémi- 
ques et des entrées lexicales par le biais de ces codes. 

Décision lexicale phonologique. Le sujet doit décider si un pseudo¬ 
mot est homophone d’un mot de la langue française (par exemple : phoule - 
foule- vs phabi). Vingt-quatre pseudo-mots, de 2 à 3 syllabes, ont été cons¬ 
truits à partir de mots dont la fréquence d’occurrence dans la langue est éle¬ 
vée (le logarithme en base 10 de la fréquence pour 100 millions est en 
moyenne de 3.7; Content, Mousty & Radeau, 1990) et de mots dont la fréquen¬ 
ce d’occurrence dans la langue est basse (le logarithme en base 10 de la fré¬ 
quence pour 100 millions est en moyenne de 1.7; Content & al., 1990). La 
transformation d’un mot en pseudo-mot s’effectue en modifiant soit un gra- 
phonème fréquent (i, f,...), soit un graphonème rare (y, ph,...) de la première 
syllabe (Veronis, 1986). Le sujet dispose de 16 items d’entraînement répartis 
en 2 blocs et de 48 items expérimentaux répartis en 6 blocs. 

Décision phonologique à choix forcé 1. Dans cette épreuve, on présen¬ 
te simultanément deux non-mots l’un en dessous de l’autre. Le sujet doit dé¬ 
cider si les deux items se prononcent de la même façon. Les items sont de une 
syllabe (en moyenne 4 lettres et 3 phonèmes) ou deux syllabes (les items de 
2 syllabes sont construits à partir des items d’une syllabe, en moyenne 7.5 let¬ 
tres et 5 phonèmes) et peuvent être homographes et homophones (naubir 
naubir) ou simplement homophones (naubir neaubir). Le sujet dispose de 16 
items d’entraînement répartis en 2 blocs et de 64 items expérimentaux répar¬ 
tis en 8 blocs. 

Décision phonologique à choix forcé 2. Dans cette épreuve, le sujet 
doit décider si un mot et un non-mot présentés simultanément l’un en dessous 
de l’autre se prononcent de la même façon (monsieur mecieu). Les mots peu¬ 
vent être de fréquence d’occurrence élevée (le logarithme en base 10 de la fré¬ 
quence pour 100 millions est en moyenne de 3.7; Content & al., 1990) ou basse 
(le logarithme en base 10 de la fréquence pour 100 millions est en moyenne 
de 1.6; Content & al., 1990), régulier ou irrégulier (Content, 1991). Les non- 
mots sont construits en régularisant les mots. Le sujet dispose de 12 items 
d’entraînement et de 96 items expérimentaux répartis en 8 blocs. 
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2 . 2.3 Les épreuves testant l'étape lexicale 

Quatre épreuves de décision lexicale (jugement d’appartenance à la 
langue française) permettent de tester la vitesse d’activation des entrées lexi¬ 
cales; une cinquième épreuve teste l’activation des concepts. 

Amorçage orthographique. On demande au sujet de décider si un mot 
(cible) précédé par une amorce appartient à la langue française. La cible est 
fréquente (le logarithme en base 10 de la fréquence pour 100 millions est en 
moyenne de 3.7; Content & al., 1990) ou rare (le logarithme en base 10 de la 
fréquence pour 100 millions est en moyenne de 1.7; Content & al., 1990). 
L’amorce est constituée par le mot écrit en lettres majuscules, le temps d’affi¬ 
chage de l’amorce (SOA, Stimulus Onset Asynchrony) peut être court (50 ms) 
ou long (100 ms). Le sujet dispose de 24 items d’entraînement répartis en 2 
blocs et de 72 items expérimentaux répartis en 6 blocs. 

Décision lexicale 1. Dans cette épreuve les mots sont plus ou moins 
fréquents (le logarithme en base 10 de la fréquence pour 100 millions est en 
moyenne de 4 pour les mots fréquents et de 1.8 pour les mots rares; Content 
& al., 1990). En ce qui concerne les non-mots, ils peuvent être soit non pro¬ 
nonçables (constitués exclusivement de consonnes), soit prononçables (cons¬ 
titués de consonnes et voyelles). Les mots comme les non-mots sont de 
différentes longueurs (de 3 à 9 lettres). Le sujet dispose de 24 items d’entraî¬ 
nement répartis en 2 blocs et de 84 items expérimentaux répartis en 7 blocs. 

Décision lexicale 2. Dans cette épreuve les mots (identiques à ceux 
utilisés dans la décision phonologique à choix forcé 2) sont réguliers ou irré¬ 
guliers (Content, 1991) et de fréquences différentes (le logarithme en base 10 
de la fréquence pour 100 millions est en moyenne de 3.8 pour les mots fré¬ 
quents et de 1.6 pour les mots rares; Content & al., 1990). En ce qui concerne 
les non-mots, ils peuvent être soit non prononçables (constitués exclusive¬ 
ment de consonnes), soit prononçables (constitués de consonnes et voyelles). 
Le sujet dispose de 12 items d’entraînement et de 96 items expérimentaux ré¬ 
partis en 8 blocs. 

Décision lexicale 3. Dans cette épreuve les mots sont plus ou moins 
fréquents (le logarithme en base 10 de la fréquence pour 100 millions est en 
moyenne de 5.3 pour les mots fréquents et de 3.5 pour les mots rares; Content 
& al., 1990) et de différentes classes (classe ouverte : verbes, substantifs, ad¬ 
jectifs; classe fermée : prépositions, conjonctions, adjectifs possessifs,...; Se- 
gui, Mehler, Frauenfelder & Morton, 1982). En ce qui concerne les non-mots, 
ils peuvent être soit non prononçables (constitués exclusivement de conson¬ 
nes), soit prononçables (constitués de consonnes et voyelles). Le sujet dispo¬ 
se de 20 items d’entraînement répartis en 2 blocs et de 80 items 
expérimentaux répartis en 8 blocs. 

Catégorisation sémantique (Collins & Loftus, 1975; Cordier, 1980). 
Dans cette épreuve le sujet doit décider si un item écrit en minuscule appar¬ 
tient à la catégorie affichée en majuscule sur l’écran (OISEAU moineau). Les 
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items peuvent être soit typiques (moineau pour la catégorie OISEAU) soit aty¬ 
piques (autruche), soit proches (papillon) soit éloignés (chaise) de la catégo¬ 
rie. Le sujet dispose de 8 items d’entraînement et de 64 items expérimentaux 
répartis en 8 blocs. 

2 . 2.4 Les épreuves non linguistiques 

Il s’agissait, pour les deux épreuves concernées, de recueillir un temps 
de réaction moteur sur un matériel qui ne soit pas linguistique. 

Temps de réaction simple. Dans cette épreuve, le sujet doit appuyer 
sur une des touches du clavier lors de l’apparition d’un signe en forme de 
coeur. L’intervalle de temps précédent l’apparition du coeur à l’écran varie de 
250 à 2500 ms. Cette épreuve comporte 20 items d’entraînement répartis en 
2 blocs et 30 items expérimentaux répartis en 3 blocs. 

Temps de réaction à choix forcé. Le sujet doit décider si le signe qui 
apparaît à l’écran est un coeur ou un carré. Cette épreuve comporte 10 items 
d’entraînement et 30 items expérimentaux répartis en 3 blocs. Le temps de 
réaction moyen pour les réponses « oui» correctes constitue le temps de réac¬ 
tion de base du sujet. Ce temps sera systématiquement retiré du temps de 
réaction moyen des épreuves linguistiques. 

2 . 2.5 Les épreuves de lecture 

Deux épreuves de lecture, l’une de textes, l’autre de mots isolés, se 
déroulent au moyen de la technique d’Auto-Présentation Segmentée II (Lété, 
Zagar & Pynte, 1994). 

Lecture de textes. Les sujets lisent en mot à mot 18 textes de 5 pro¬ 
positions et de 27 à 43 mots (Lété et al., 1994). Ils disposent de 3 textes d’ap¬ 
prentissage et effectuent un jugement de titre à la fin de chaque texte. 

Lecture de mots. Après 3 listes d’apprentissage, les sujets lisent en 
mot à mot 19 listes constituées de 5 à 13 mots. Les listes sont construites de 
façon à intégrer des mots de fréquence et de longueur différentes, ainsi que 
des mots lus en contexte (lecture de textes). A la fin de chaque liste, les sujets 
effectuent un jugement de synonymie sur le dernier mot de la liste. 

2.3 Etalonnage 

2 . 3.1 Sujets 

Cent-soixante sujets ont passé l’ensemble des épreuves. Ils ont été ré¬ 
partis en trois groupes selon leur niveau scolaire. Le groupe 1 comprend 57 
personnes de niveau second cycle du secondaire et plus (baccalauréat et 
plus), âgées de 18 à 28 ans (moyenne = 21.5 ans), 34 sujets féminins et 23 
masculins; le groupe 2 est composé de 65 personnes de niveau fin de premier 
cycle du secondaire (CAP, BEP, BEPC), âgées de 18 à 47 ans (moyenne = 23 
ans), 10 sujets féminins et 55 masculins; enfin le groupe 3 est formé de 38 per- 
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sonnes de niveau fin d’études primaires, âgées de 16 à 57 ans (moyenne = 27 
ans), 13 sujets féminins et 25 masculins, qui participaient pour la majorité 
d’entre eux à des stages de remise à niveau en français et mathématique. Ces 
sujets n’ont été soumis à aucun test de lecture préalable. 

2 . 3.2 Procédure 

Pour les épreuves à temps de réaction, les sujets effectuent leur déci¬ 
sion en utilisant deux touches du clavier. La main dominante est associée aux 
réponses «oui». 

La passation des épreuves se déroule dans un ordre prédéterminé 
pour tous les sujets en quatre séances d’environ une heure, à raison d’au maxi¬ 
mum une passation par demi-journée. La première session comprenait les 
épreuves suivantes (entre parenthèses est précisée l’abréviation du nom de 
l’épreuve) : temps de réaction simple (TRS), temps de réaction à choix forcé 
(TRC), codage abstrait des lettres (COD), lecture de textes (LMM); la secon¬ 
de session comprenait de nouveau l’épreuve de temps de réaction à choix for¬ 
cé (TRC), suivi du jugement d’identité de lettres (JIL), du jugement de 
similitude de deux ensembles prononçables de lettres (SM2), de la décision 
lexicale 1 (DL1), de la décision phonologique à choix forcé 1 (PHI) et de la 
lecture de mots (LHC). Lors de la troisième session, les épreuves étaient : 
TRC, décision lexicale 2 (DL2), amorçage orthographique (AOR), catégorisa¬ 
tion sémantique (SEM) et décision phonologique à choix forcé 2 (PH2). Enfin 
dans la dernière session, les sujets effectuaient les épreuves suivantes : TRC, 
décision lexicale 3 (DL3), jugement de similitude de deux ensembles non-pro¬ 
nonçables de lettres (SMI) et décision lexicale phonologique (PHO). 

3. RÉSULTATS 


En présentant quelques résultats, nous voudrions essayer de répon¬ 
dre à deux questions : 

1. quelles différences peut-on mettre en évidence pour les trois groupes 
quant à la vitesse de résolution des tâches et donc au niveau de l’acti¬ 
vation des processus qu’elles testent ? Pour répondre à cette ques¬ 
tion, nous nous appuierons sur les résultats moyens de chaque 
groupe. 

2. quelles différences peut-on observer entre lecteurs d’un même 
groupe ? Nous analyserons pour ce faire les résultats des sujets en 
fonction des classes effectuées lors de l’étalonnage (i.e. en fonction 
de leur position sur la distribution des notes centrées réduites). 

3.1 Vitesse de lecture et compréhension 

Les trois groupes se différencient-ils du point de vue des épreuves de 
lecture ? 
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Comme le montre le Tableau 1, la lecture est plus rapide dans le cas 
d’une lecture de textes (LMM) que dans celui de listes de mots (LHC), respec¬ 
tivement 622 millisecondes par mot (ms/mot) vs 788 ms/mot (F (1, 157) = 
124.03, p c.001). Cette vitesse diminue en fonction du niveau de qualification : 
plus les lecteurs sont qualifiés et moins ils passent de temps sur chaque mot 
(434 ms/mot pour le groupe 1; 695 ms/mot pour le groupe 2 et 1128 ms/mot 
pour le groupe 3; F (2, 157) = 52.22, p <.001). 

Tableau 1 

Vitesse moyenne de lecture, pourcentage du temps d'appui et pourcentage 
de bonnes réponses pour chacun des trois groupes 


Groupes 


1 

2 

3 

Moy 

LMM 

387 

626 

967 

622 

vitesse 

(130) 

(291) 

(437) 

(364) 


50 

54 

54 

53 

%TA 

(11) 

(14) 

(17) 

(14) 


96 

92 

88 

83 

%BR 

(5) 

(9) 

(12) 

(9) 

LHC 

481 

765 

1290 

788 

vitesse 

(162) 

(339) 

(618) 

(489) 


47 

60 

60 

56 

%TA 

(13) 

(17) 

(19) 

(17) 


87 

83 

78 

92 

%BR 

(6) 

(7) 

(12) 

(9) 


Note : écarts-types entre parenthèses. 

Vitesse en millisecondes par mot, %TA = pourcentage de temps de lecture par mot; %BR = pourcen¬ 
tage de bonnes réponses, LMM = lecture de textes; LHC = lecture de listes de mots. 


Par ailleurs, le ralentissement de la vitesse de lecture est d’autant plus 
important en l’absence de contexte que le niveau scolaire est faible (+94 ms/ 
mot pour le groupe 1, +139 ms/mot pour le groupe 2 et +323 ms/mot pour le 
groupe 3; F (2,157) = 15.34, p c.001). L’effet facilitateur du contexte est donc 
plus important pour les lecteurs les moins efficients (pour une revue, cf. Bec¬ 
ker, 1985) ce qui apparaît conforme aux résultats de West et Stanovich 
(1982). 

Au niveau de la compréhension, le jugement de titre est moins bien 
réussi que le jugement de synonymie (83 vs 92 % de bonnes réponses; F (1, 
157) = 135.21, p c.001). 

Les sujets du groupe 1 réussissent globalement mieux (respective¬ 
ment pour les groupes 1,2 et 3 ; 91,87 et 83 % de bonnes réponses; F (2,157) 
= 16.88, p c.001). En revanche, contrairement à la vitesse de lecture, le nom- 
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bre de bonnes réponses (par ailleurs très élevé) ne varie pas de façon statisti¬ 
quement significative d’une épreuve à l’autre en fonction du niveau scolaire (F 
< 1). 

En ce qui concerne la façon dont s’effectue la lecture, on peut noter 
que le temps d’affichage des mots à l’écran (%TA) est proportionnellement 
plus important lors de la lecture de listes de mots que lors de la lecture de tex¬ 
tes (le temps d’appui représente respectivement 56 et 53% du temps de lec¬ 
ture d’un mot; F (1, 157) = 15.45, p c.001). La part du temps d’appui varie en 
fonction du niveau scolaire : les lecteurs de faible niveau gardent le mot plus 
longtemps à l’écran (en moyenne : 48 % pour le groupe 1 ; 57 % pour les grou¬ 
pes 2 et 3; F (2, 157) = 7.32, p c.001). En l’absence de contexte, l’augmenta¬ 
tion du temps d’appui est d’autant plus importante que les sujets sont des 
lecteurs lents (-3 % pour le groupe 1, +6 % pour les groupe 2 et 3; F (2, 157) 
= 13.31, p c.001). Ce résultat apparaît conforme aux résultats de Oison, Kliegl, 
Davidson et Foltz (1985) qui ont distingué deux types de lecteurs : des lec¬ 
teurs «laborieux» et des lecteurs «explorateurs», les premiers prenant plus 
de temps pour assurer la reconnaissance des mots, les seconds se limitant à 
encoder suffisamment d’informations visuelles afin de poursuivre ultérieure¬ 
ment les traitements subséquents. 

Afin d’évaluer plus précisément l’influence du contexte, nous avons 
calculé l’effet de facilitation associé à la présentation des mots en contexte, en 
analysant les temps d’appui et de lâcher pour 105 mots communs aux deux 
épreuves de lecture (cf. Tableau 2). 

Tableau 2 

Effet (en ms) de facilitation du contexte sur les temps d'appui (TA) et de lâcher (TL) 
pour chacun des trois groupes. 


Groupes 


1 

2 

3 

Moy 

TA 

-43 

-128 

-230 

-122 


(73) 

(123) 

(219) 

(155) 

TL 

-66 

-26 

-72 

-51 


(86) 

(111) 

(203) 

(132) 

Moyenne 

-54 

-77 

-151 



Note : écarts-types entre parenthèses 


La facilitation associée à la présentation des mots en contexte appa¬ 
raît en moyenne plus importante pour les temps d’appui que pour les temps 
de lâcher (respectivement -122 et -51 ms; F (1, 157) = 24.60, p c.001), pour 
les lecteurs les plus lents que pour les lecteurs rapides (-151 ms pour le grou¬ 
pe 3, -77 ms pour le groupe 2 et -54 ms pour le groupe 1; F (2,157) = 12.56, p 
c.001). Cependant, cette facilitation ne se manifeste pas de la même façon 
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pour les trois groupes. Pour le groupe 1, elle a tendance à être plus importante 
sur les temps de lâcher que sur les temps d’appui (z = 1.53, p <.06), alors que 
pour les groupes 2 et 3 elle intervient massivement sur les temps d’appui (F 
(2,157) = 10.95, p <.001; groupe 2, z = 4.96, p <.01; groupe 3, z = 3.26, p <.01). 
Les lecteurs les moins efficients éprouvent donc une difficulté au niveau de 
l’extraction des informations écrites lorsqu’ils ne peuvent s’appuyer sur le 
contexte; ce qui conforte le fait que le bon lecteur n’a pas besoin de contexte 
pour identifier efficacement les mots (West et Stanovich, 1978, 1982). 

Dans un premier temps, le niveau scolaire peut donc être considéré 
comme un bon estimateur du niveau de lecture. 

Les sujets du groupe 1 (niveau baccalauréat et plus) constituent un 
groupe de lecteurs rapides (387 et 481 ms/mot en LMM et LHC) et «bons 
compreneurs » (96 et 87 % de bonnes réponses pour les jugements de titre et 
de synonymie), qui équilibrent leurs ressources cognitives entre l’extraction 
et l’intégration de l’information (respectivement 50 et 47 % d’appui en LMM 
et LHC). 

Par comparaison, les sujets du groupe 3 (niveau fin d’études primai¬ 
res) forment un groupe de lecteurs très lents (967 et 1290 ms/mot, soit trois 
fois plus que les lecteurs du groupes 1), plus faibles au niveau de la compré¬ 
hension bien que les performances restent élevées (88 et 78 % de bonnes ré¬ 
ponses) et qui ont besoin de plus de temps pour extraire les informations du 
mot affiché à l’écran (54 et 60 % d’appui en LMM et LHC) et donc pour recon¬ 
naître ce mot. 

Enfin, les sujets du groupe 2 (niveau fin du premier cycle du secon¬ 
daire) peuvent être considérés comme constituant un groupe intermédiaire 
au niveau de la compréhension (respectivement 92 et 83 % de bonnes répon¬ 
ses en LMM et LHC). Au niveau de la vitesse de lecture (respectivement, 626 
et 765 ms/mot en LMM et LHC), ils apparaissent plus proches des lecteurs du 
groupe 1 (+239 et +284 ms en LMM et LHC) que de ceux du groupe 3 (res¬ 
pectivement +341 et +525 ms). En revanche, en ce qui concerne les processus 
d’extraction de l’information, ils sont comparables à ceux du groupe 3 (54 et 
60 % d’appui en LMM et LHC). 

3.2 Épreuves non-linguistiques 

L’analyse des résultats aux épreuves non-linguistiques : temps de 
réaction simple (TRS) et temps de réaction à choix forcé (TRC) permet de 
mettre en évidence des différences entre les trois groupes au niveau des 
temps de réaction (cf. Tableau 3). 
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Tableau 3 

Temps de réaction moyen (en ms) pour les épreuves de temps de réaction simple 
(TRS) et de temps de réaction à choix forcé (TRC) pour chacun des trois groupes 


Groupes 


1 

2 

3 

Moy 

TRS 

289 

339 

392 

334 


(32) 

(86) 

(128) 

(93) 

TRC 

378 

432 

473 

423 


(39 

(70) 

(89) 

(76) 


Le temps de réaction moyen est moins élevé en TRS qu’en TRC (340 
vs 428 ms; F (1,157) = 231.83, p c.001). En revanche, si globalement le temps 
de réaction augmente quand le niveau scolaire diminue (F (2,157) = 24.87, p 
c.001), la différence entre les deux épreuves est identique pour les trois grou¬ 
pes (respectivement 89, 93 et 81 ms; F < 1). Autrement dit, dans le cas 
d’épreuves non linguistiques, le surcroît de difficulté associé à la décision 
(s’agit-il oui ou non de...., ici s’agit-il oui ou non d’un coeur ?) est le même quel 
que soit le niveau d’étude. 


3.3 Processus impliqués dans la reconnaissance des mots 

Afin d’obtenir un indicateur «au plus près» du temps nécessaire à la 
mise en oeuvre des processus impliqués dans les étapes visuelle, phonologi¬ 
que ou lexicale, nous avons soustrait, pour chaque sujet, son temps de réac¬ 
tion moyen dans l’épreuve TRC (temps de réaction à choix forcé) à son temps 
de réaction moyen pour chacune des épreuves testant une étape particulière. 
Cette mesure (ici appelé coût) correspond donc au temps nécessaire à l’exé¬ 
cution d’une tâche moins un temps de décision et de programmation motrice 
(temps qui ne nous intéresse pas ici). Ce sont les résultats pour les coûts as¬ 
sociés aux processus que nous présentons ici et cela en fonction des différen¬ 
tes étapes préalablement définies. 

3 . 3.1 Etape visuelle 

Existe-t-il des différences entre les groupes dès les épreuves testant 
les processus d’activation des codes graphémiques et d’analyse d’une chaîne 
de caractères ? 

Le Tableau 4 présente pour chaque groupe le coût associé aux diffé¬ 
rentes épreuves d’évaluation de l’étape visuelle . 

Nous pouvons observer dans un premier temps une progression dans 
la difficulté associée aux tâches : COD (codage abstrait des lettres) est réussi 
plus rapidement que JIL (jugement d’identité de lettres; z = 17.12, p <.01) et 
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JIL plus rapidement que SM2 (jugement de similitude de 2 ensembles de let¬ 
tres prononçables; z = 12.08, p c.Ol). Par ailleurs, en ce qui concerne les 
épreuves de jugement de similitude de deux ensembles de lettres prononça¬ 
bles (SMI) ou non-prononçables (SM2), on peut noter que, si le coût augmen¬ 
te en fonction du groupe (F (2, 152) = 30.54; p c.001) et en fonction de 
l’épreuve (F (1, 152) = 643.76; p <.001), en revanche, la facilitation apportée 
par la prononçabilité des suites de lettres n’apparaît pas significativement dif¬ 
férente pour les trois groupes, le coût de la tâche étant divisé par deux (Grou¬ 
pe 1, -629 ms; Groupe 2, - 656 ms; Groupe 3, -752 ms : F (2, 152) = 2.13; p 
<. 12 ). 

Dans toutes les épreuves, le coût associé à la tâche (et donc aux pro¬ 
cessus d’activation des codes graphémiques et/ou d’analyse de la chaîne de ca¬ 
ractères) diminue en fonction du niveau scolaire : les sujets du groupe 1 étant 
plus rapides que ceux des groupes 2 et 3 et ceux du groupe 2 plus rapides que 
ceux du groupe 3 (cf. Annexe 2). Donc, à l’exception de l’épreuve de codage 
abstrait des lettres pour laquelle les groupes 2 et 3 ne se différencient pas 
(COD; z =.83, p <.21), il existe, comme en lecture, une progression entre les 
trois groupes : plus le niveau scolaire est faible, plus le coût associé aux épreu¬ 
ves est élevé. Cependant, contrairement aux résultats obtenus en lecture, le 
groupe 2 semble plus proche du groupe 3 que du groupe 1 : excepté pour SMI, 
les différences entre les coûts sont plus importantes entre les groupes 1 et 2 
(pour COD : +35 ms; JIL : +102 ms; SMI : +254 ms; SM2 : +227 ms) qu’entre 
les groupes 2 et 3 (respectivement; +15, +71, +256, +160 ms). 

Tableau 4 

Coût moyen (en ms) pour les épreuves testant l'étape visuelle pour chacun des trois 
groupes 


Groupes 


1 

2 

3 

Moy 

COD 

133 

168 

183 

159 


(40) 

(87) 

(90) 

(77) 

JIL 

298 

400 

471 

380 


(69) 

(128) 

(183) 

(144) 

SMI 

1140 

1394 

1650 

1368 


(305) 

(390) 

(557) 

(466) 

SM2 

511 

738 

898 

696 


(125) 

(289) 

(338) 

(298) 


Note : écarts-type entre parenthèses. 

Codage abstrait des lettres (COD), Jugement d'identité de Lettres (JIL), Jugement de Similitude de 2 
ensembles de lettres non-prononçables (SMI) ou prononçables (SM2). 


Ainsi, dès la mise en oeuvre des processus d’activation des codes gra¬ 
phémiques et d’analyse d’une chaîne de caractères, les groupes 2 et 3 obtien¬ 
nent des coûts supérieurs à ceux du groupe 1. Il semble donc qu’une partie 
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des difficultés de lecture peut être associée à des difficultés observables dès 
le traitement des lettres. 

3 . 3.2 Étape phonologique 

Qu’en est-il des différences au niveau des processus mis en oeuvre 
dans les tâches testant l’étape phonologique ? 

Pour les trois épreuves concernées, on peut observer (cf. Tableau 5), 
comme précédemment, un effet du groupe (F (2,138) = 45.92, p c.001). Ain¬ 
si, dans toutes les épreuves le groupe 1 réussit plus rapidement que le groupe 
2, qui lui même réussit plus rapidement que le groupe 3 (cf. Annexe 2), à l’ex¬ 
ception toutefois de la décision lexicale phonologique (PHO) pour laquelle les 
groupes 2 et 3 ne se différencient pas (z = 1.41, p <.08). 

Tableau 5 

Coût moyen (en ms) pour les épreuves testant l'étape phonologique pour chacun 
des trois groupes. 


Groupes 


1 

2 

3 

Moy 

PHO 

394 

593 

672 

547 


(101) 

(222) 

(264) 

(264) 

PHI 

531 

761 

991 

730 


(152) 

(259) 

(370) 

(311) 

PH2 

584 

866 

1030 

795 


(153) 

(300) 

(422) 

(336) 


Note : écarts-types entre parenthèses. 

Décision lexicale phonologique (PHO), décision phonologique à choix forcé 1 (PHI) et 2 (PH2) 


On observe également un effet de la tâche (F (2, 276) = 106.91, p 
<.001) ainsi qu’une interaction entre le groupe et la tâche (F (4, 276) = 3.87, 
p c.004) : PHO donne lieu à des coûts moins élevés que la décision phonolo¬ 
gique à choix forcé 1 qui concerne 2 non-mots (PHI; pour le groupe 1, z = 
5.77, p <.01; pour le groupe 2, z = 3.88, p<.01; pour le groupe 3, z = 4.07, p 
<.01), qui elle-même donne lieu à des coûts moins élevés que la décision pho¬ 
nologique à choix forcé 2 qui concerne un mot (régulier ou irrégulier) et un 
non-mot (PH2; pour le groupe 1, z = 1.85, p <.05; pour le groupe 2, z = 2.11, p 
<.05). De nouveau, on retrouve une certaine hiérarchie entre niveau scolaire 
et coût cognitif dans la réalisation des épreuves. Comme pour les épreuves 
testant l’étape visuelle les performances du groupe 2 sont plus proches de cel¬ 
les du groupe 3 (PHO : +79 ms; PH2 : +164) que de celles du groupe 1 (res¬ 
pectivement +199 et +282 ms), excepté pour PHI où la différence est dans les 
deux cas de 230 ms. On peut également relever une particularité du groupe 3 : 




118 La lecture 


il se différencie des deux autres groupes dans la mesure où l’écart de 39 ms 
observé entre PHI et PH2 s’avère non significatif (z =.40, p <.34). Le fait d’être 
face à un mot et un non-mot plutôt que face à deux non-mots ne modifie donc 
en rien les performances des sujets du groupe 3, comme si ce groupe procé¬ 
dait de la même façon dans les deux cas. 

Les résultats mettent en évidence des difficultés au niveau de l’étape 
de traitement phonologique avec un déficit plus marqué dans le cas des lec¬ 
teurs du groupe 3. 

3 . 3.3 Étape lexicale 2 

Quelles sont les différences observables entre les trois groupes du 
point de vue de l’activation des mots ? 

Le Tableau 6 présente les résultats pour quatre épreuves testant l’ac¬ 
tivation des entrées lexicales par la voie directe et des concepts au sein du 
lexique. 

Tableau 6 

Coût moyen (en ms) pour les épreuves testant l'étape lexicale pour chacun des trois 
groupes 


Groupes 


1 

2 

3 

Moy 

DL1 

185 

286 

378 

272 


(54) 

(117) 

(249) 

(162) 

DL2 

184 

254 

323 

245 


(46) 

(103) 

(182) 

(124) 

DL3 

98 

127 

181 

130 


(36) 

(63) 

(187) 

(106) 

SEM 

399 

545 

660 

519 


(101) 

(193) 

(311) 

(225) 


Note : écarts-types entre parenthèses. 

Décision lexicale 1 (DL1), 2 (DL2) et 3 (DL3) et catégorisation sémantique (SEM). 


L’analyse de variance sur les trois épreuves de décision lexicale met 
en évidence un effet du groupe (F (2, 155) = 35.80, p c.001) : quelle que soit 
l’épreuve, le groupe 1 est plus rapide (cf. Annexe 2); un effet de la tâche 
(F (2, 310) = 252.17, p c.001) ainsi qu’une interaction entre groupe et tâche 
(F (4, 310) = 10.59, p c.001). La décision lexicale 3 est réussie plus rapide¬ 
ment que la décision lexicale 2 (groupe l:z=11.12,pc.01; groupe 2 : z = 
8.43, p c.01; groupe 3 : z = 3.33, p c.01) et que la décision lexicale 1 (respec- 


2 Nous ne présenterons pas ici les résultats de l’épreuve d’amorçage orthographique, la 
moyenne des temps de réaction (moyennant des effets de facilitation et d’inhibition) n’étant pas 
pertinente. 
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tivement, z = 10.12, z = 9.64 et z = 3.90, p <.01). La plus grande rapidité en 
DL3 peut sans doute s’expliquer par le fait que la fréquence des mots utilisés 
est plus élevée dans cette épreuve que dans les deux autres épreuves de dé¬ 
cision lexicale. En revanche, seul le groupe 2 semble présenter un coût légè¬ 
rement différent entre DL1 et DL2 (groupe 2, z = 1.65, p <.05; groupe 1, z 
=.11, p <.46; groupe 3, z = 1.06, p <.14). 

Enfin, les résultats pour la catégorisation sémantique (SEM) font ap¬ 
paraître que le coût diminue quand le niveau scolaire augmente (cf. Annexe 
2). Il n’y a rien ici de très surprenant dans la mesure où, pour activer la signi¬ 
fication d’un mot écrit, il faut préalablement activer une entrée lexicale et que 
l’analyse des résultats montre que les processus impliqués dans cette activa¬ 
tion sont déficients. 

De nouveau, les épreuves montrent que les lecteurs les plus lents sont 
plus lents dans l’activation des entrées lexicales. Toutefois, dans la mesure où 
il existe une certaine hiérarchie entre les différentes étapes de traitement, on 
ne peut pas parler, à ce niveau de l’analyse, d’une difficulté spécifique, les lec¬ 
teurs ayant dû effectuer auparavant un certain nombres d’opérations (au 
moins visuelles, si ce n’est phonologiques). 

Cette première analyse des résultats a permis de mettre en évidence 
les différences existant entre les trois groupes. En moyenne, les groupes 2 et 
3 se différencient systématiquement du groupe 1 par des coûts supérieurs. 
Comme en lecture, le groupe 2 présente des résultats intermédiaires. Cepen¬ 
dant, contrairement à la vitesse de lecture, le groupe 2 est souvent plus proche 
des résultats du groupe 3 que de ceux du groupe 1 ; et pour deux épreuves 
(COD, PHO), les différences observées avec le groupe 3 ne sont statistique¬ 
ment pas significatives. Cette progression, dans les coûts associés aux épreu¬ 
ves, au travers des trois groupes, peut sans doute être mise en relation avec 
l’hypothèse qu’il existerait un continuum dans l’automatisation des processus. 
D’ailleurs, l’étude des coefficients de corrélation entre les vitesses moyennes 
de lecture (en lecture de textes -LMM- et en lecture de listes de mots -LHC) 
et les coûts associés à chaque épreuve d’évaluation (cf. Tableau 7) montre 
qu’aucune corrélation significative n’est observée entre les épreuves de lectu¬ 
re et les 12 épreuves testant les processus impliqués dans la reconnaissance 
des mots pour le groupe 1; alors que 9 épreuves pour le groupe 2 et 10 épreu¬ 
ves pour le groupe 3 sont corrélées aux deux épreuves de lecture. 

Tout semble donc se passer comme si en lecture, pour les groupes 2 
et 3, une partie importante des ressources attentionnelles était allouée aux 
processus menant à la reconnaissance des mots. 

En ce qui concerne les relations entre les processus qui mènent à la 
reconnaissance des mots, l’étude des coefficients de corrélation fait ressortir 
la complexité des liens qu’entretiennent les différentes épreuves en fonction 
du niveau de lecture : on pouvait s’attendre, d’une part, à ce que les épreuves 
regroupées au sein d’une même étape soient à la fois plus souvent et plus for¬ 
tement intercorrélées entre elles qu’avec les épreuves testant d’autres étapes; 
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d’autre part, à ce qu’il n’y ait pas ou peu de différences entre les groupes. Ce 
n’est pas le cas (cf. Annexe 3). Pour les groupes 1 et 2, le nombre important 
de corrélations entre les épreuves de diagnostic (de 8 à 10 épreuves corrélées 
pour le groupe 1; de 9 à 10 pour le groupe 2) suggère que ces épreuves met¬ 
tent en oeuvre des processus qui, s’ils ne sont pas identiques, sont suffisam¬ 
ment proches (ou nécessitent les mêmes ressources attentionnelles) pour 
qu’une analyse des corrélations ne permette pas de les dissocier. Le groupe 3 
apparaît différent dans la mise en oeuvre des processus. En effet, les proces¬ 
sus semblent beaucoup moins dépendants les uns des autres pour ce groupe 
(de 0 à 8 épreuves sont corrélées) que pour les groupes 1 et 2. On peut se de¬ 
mander dans quelle mesure il n’existerait pas des systèmes de traitement de 
l’information différents selon le niveau d’efficience en lecture (peut-être par 
la mise en oeuvre de systèmes compensatoires ?). En attendant de pouvoir ré¬ 
pondre à cette question, voyons quelles sont les différences observables au 
sein d’un même groupe. 

Tableau 7 

Coefficients de corrélation entre les vitesses en lecture de textes (LMM) et en lecture 
de listes de mots (LHC) et les coûts moyens dans les différentes épreuves 
linguistiques pour chacun des trois groupes. 


Groupes 


1 

2 

3 


LMM 

LHC 

LMM 

LHC 

LMM 

LHC 

COD 

.20 

.11 

.12 

.16 

.19 

.04 

JIL 

.12 

20 

.38** 

.43** 

.61** 

.57** 

SMI 

.19 

.20 

.34** 

.32* 

.60** 

.51** 

SM2 

.14 

.08 

.52** 

.49** 

. 68 ** 

.71** 

PHO 

.11 

.13 

.32** 

.25* 

-.17 

-.30 

PHI 

.19 

.23 

44 ** 

.43** 

.63** 

.70** 

PH2 

.17 

.09 

.41** 

.37** 

.62** 

.64** 

DL1 

.19 

.16 

.38** 

.32** 

.50** 

.60** 

DL2 

.09 

-.01 

.27* 

.27* 

.57** 

.59** 

DL3 

.16 

.10 

.10 

.09 

.43** 

.50** 

SEM 

.25 

.11 

.20 

.12 

49 ** 

.58** 


Note : * p<.05, ** p<.01. Quand les sujets commettaient en moyenne plus de 50% d'erreurs dans une 
épreuve, nous n'avons pas pris en compte leur temps de réaction. Nous précisons ici le nombre de 
sujets lorsque celui-ci est intérieur à celui attendu. SMI: Groupe 2 (effectif normal: 65 sujets): 61 
sujets. Groupe 3 (effectif normal: 38 sujets): 37 sujets. PHO: Groupe 2, 60 sujets; Groupe 3, 30 sujets. 
PHI: Groupe 2,64 sujets; Groupe 3, 36 sujets. PH2: Groupe 2,63 sujets; Groupe 3,32 sujets. DL2: 
Groupe 2,64 sujets; Groupe 3,37 sujets. SEM: Groupe 3,37 sujets. 


3 . 3.4 Quelles différences peut-on observer 

entre les «mauvais» lecteurs ? Analyse des profils 

Nous avons vu au cours de l’analyse précédente que les épreuves per¬ 
mettaient de mettre en évidence des différences entre les trois groupes de ni- 
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veau du point de vue du coût associé à la mise en oeuvre des différents 
processus impliqués dans la reconnaissance des mots. L’objectif de cette par¬ 
tie sera de montrer que ces épreuves permettent de mettre en évidence des 
difficultés différentes d’un «mauvais» lecteur à l’autre. Pour ce faire nous 
avons analysé les distributions effectuées lors de l’étalonnage. 

Pour l’ensemble de la population (160 sujets), une distribution en 9 
classes a été effectuée pour chaque coût après transformation des mesures 
(d’abord en logarithme puis en notes centrées réduites). De cette façon, il est 
possible de situer (pour chaque indicateur) chacun des sujets dans une des 9 
classes ainsi établies (Zagar, Jourdain et Lété, 1993). A partir du positionne¬ 
ment de chaque sujet, nous avons repris les distributions en séparant chacun 
des groupes (cf. pour exemple les Figures 2 et 3). Pour effectuer une analyse 
des difficultés spécifiques à chaque sujet, nous avons pris uniquement en 
compte les sujets des groupes 2 et 3 qui se situaient au-delà de la distribution 
des sujets du groupe 1. A deux exceptions près (en SMI, le sujet 149 et en PH2 
le sujet 105), on ne trouve pas de sujets du groupe 1 au-delà de la sixième clas¬ 
se, qui correspond à la moyenne générale plus 1.125 écart-type. 

Comment les sujets des groupes 2 et 3 se répartissent-ils dans chacu¬ 
ne des épreuves ? (cf. Annexes 4 à 6) 

En ce qui concerne les épreuves de lecture, 33 % des sujets obtien¬ 
nent des temps supérieurs pour au moins l’une des deux épreuves de lecture. 
Dans la majorité des cas (59 %) les deux vitesses de lecture sont inférieures 
(i.e. au-delà de 924 ms/mot en LMM et de 1191 ms/mot en LHC); dans 12 % 
des cas seule la lecture en contexte est plus lente (LMM) et dans 29 % des cas 
seule la lecture de listes de mots est plus lente (LHC) (cf. Tableau 8 pour la 
répartition en fonction du niveau scolaire). 



Limite de classe (en ms) 

Figure 2 

Distribution des vitesses moyennes de lecture en LMM selon le niveau scolaire 
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Limite de classe (en ms) 


Figure 3 

Distribution des vitesses moyennes de lecture en LHC selon le niveau scolaire 

Qu’en est-il des épreuves de diagnostic ? 

Sur l’ensemble des sujets qui obtiennent une vitesse de lecture infé¬ 
rieure à celle du groupe 1, seulement deux sujets (appartenant au groupe 2) 
ne présentent aucune difficulté particulière du point de vue du coût associé 
aux épreuves de diagnostic. Dans 94 % des cas, un temps de lecture supérieur 
est associé à au moins une difficulté au niveau des processus menant à la re¬ 
connaissance des mots. 

Au total 31 sujets du groupe 2 (47%) et 33 sujets du groupe 3 (87%) 
présentent une difficulté dans au moins une épreuve (cf. Annexes 4 à 6). En 
revanche, dans cette population, respectivement 64 et 39% des sujets obtien¬ 
nent des temps de lecture équivalents aux bons lecteurs (groupe 1). Si, com¬ 
me nous l’avons vu précédemment, la vitesse de lecture peut être presque 
systématiquement associée à une difficulté au niveau des processus impliqués 
dans la reconnaissance des mots, en revanche dans 51% des cas elle ne per¬ 
met pas de détecter une difficulté au niveau de ces processus (cf. Tableau 9). 

Le Tableau 8 donne, par épreuve et pour chaque groupe, le pourcen¬ 
tage de sujets qui se situent au-delà de la distribution en 9 classes des coûts 
du groupe 1. 

Sur l’ensemble des épreuves entre 5 et 30 pour-cent des sujets des 
groupes 2 et 3 (103 sujets) présentent au moins une difficulté, SMI et PHO 
étant les épreuves pour lesquelles les sujets présentent un maximum de diffi¬ 
cultés (29 et 28% des sujets sont au-delà du groupe 1); les épreuves de déci¬ 
sion lexicale (DL1, 2 et 3) étant celles qui présentent le moins de difficultés. 

Cependant, si nous nous intéressons à ce qui se passe pour chaque 
groupe, nous pouvons noter que ce sont majoritairement les sujets du groupe 
3 qui sont en difficulté. Pour ce groupe, l’ensemble des épreuves (à l’exception 
de DL3) apparaît concerné. En effet, entre 27 et 54 % des sujets sont au-delà 
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des coûts observés pour le groupe 1. Les problèmes les plus importants se si¬ 
tuant au niveau des épreuves testant la phonologie (cf. Tableau 8). 

Tableau 8 

Par épreuve, pourcentage de sujets des groupes 2 et 3 (N = 103) dont le coût moyen 
est supérieur à A 


A 

(ms) 

Groupes 

2 3 

Total 

Effectif 

65 

38 

103 


COD 

249 

12 

29 

18 

JIL 

505 

14 

34 

21 

SMI 

1835 

21 (26) 

40 

29(31) 

SM2 

942 

15 

39 

24 

PHO 

731 

20 (25) 

43 (54) 

28 (36) 

PHI 

1010 

12(14) 

44(47) 

24 (26) 

PH2 

1081 

13(15) 

31 (42) 

19(25) 

DL1 

455 

8 

16 

11 

DL2 

385 

9 (11) 

27 (29) 

16(13) 

DL3 

249 

3 

8 

5 

SEM 

698 

15 

27 (29) 

20 (20) 

LMM 

924 

1 

8 

4 

LHC 

1191 

8 

13 

10 

LMM & LHC 


9 

37 

19 


Note : critère de difficulté, égal à la moyenne générale + 1.125 écart-type; entre parenthèses pourcentage 
intégrant les sujets commettant plus de 50% d'erreurs. 

Pour le groupe 2, les sujets en difficultés représentent au maximum 
un quart de cette population (si on tient compte des sujets pour qui la difficul¬ 
té se manifeste sur le pourcentage d’erreurs), ces difficultés concernant prin¬ 
cipalement SMI et PHO. 

Quels sont les profils des sujets présentant une difficulté ? 

Pour chaque sujet présentant une difficulté (i.e. au-delà du groupe 1), 
nous avons effectué un diagnostic en terme de difficulté(s) visuelle et/ou pho¬ 
nologique et/ou lexicale (cf. Annexes 4 à 6). Le Tableau 9 synthétise ces ré¬ 
sultats en dissociant les profils associés ou non à une vitesse de lecture plus 
lente que celle du groupe 1. 

Nous pouvons différencier 3 groupes principaux. Le premier concerne 
les sujets qui présentent des difficultés à un seul niveau soit visuel (25 %), soit 
phonologique (9 %), soit lexical (7 %). 

Quand la difficulté se situe exclusivement au niveau des processus mis 
en oeuvre dans l’étape visuelle, elle peut concerner : 

a) l’activation des codes graphémiques (comme c’est le cas pour les 

sujets 203, 307 et 355; cf. Annexe 4), 
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b) l’analyse d’une chaîne de caractères (sujet 330) et/ou la comparaison 
de deux chaînes de caractères (sujets 228, 337, 208, 257, 239, 251, 
261,322,334, 336,319), 

c) les deux (sujet 207). 

Si la difficulté se manifeste uniquement pour l’étape phonologique, 
elle est essentiellement reflétée par la décision lexicale phonologique (cf. An¬ 
nexe 4). Autrement dit le problème se situe au niveau de l’activation d’une en¬ 
trée lexicale par le biais des codes phonémiques. On peut également 
remarquer qu’une difficulté à ce seul niveau ne donne pas lieu à un ralentisse¬ 
ment de la vitesse de lecture. 

Quand la difficulté est présente pour la seule étape lexicale, on peut 
différencier les problèmes au niveau de l’activation des unités lexicales (sujet 
236), des problèmes au niveau de l’activation des concepts (sujets 205 et 227). 

Tableau 9 

Répartition (en %) des 64 sujets présentant une ou plusieurs difficultés au niveau 
des processus impliqués dans la reconnaissance des mots en fonction de la vitesse de 
lecture 


Vitesse de lecture 

Effectif 

inférieure 

supérieure 

TOTAL 

VIS 

14 

11 

25 

PHO 

8 

0 

8 

LEX 

5 

2 

7 

VIS + PHO 

12 

9 

22 

VIS + LEX 

3 

o 

3 

LEX + PHO 

5 

6 

11 

VIS + PHO + 
LEX 

5 

21 

25 

TOTAL 

51 

49 

100 


Le second groupe concerne les sujets qui présentent des difficultés à 
deux niveaux : visuel et lexical (3 %), visuel et phonologique (22 %), phono¬ 
logique et lexical (11%). Les sujets réunis dans ces trois sous-groupes présen¬ 
tent des profils très différents (annexe 5). Pour les difficultés visuelles et 
lexicales, on retrouve la diversité des problèmes énumérés précédemment 
dans le cas d’une difficulté à un seul niveau (visuel ou lexical). Par contre en 
ce qui concerne les difficultés phonologiques, on voit apparaître des difficultés 
au seul niveau de l’activation des codes phonémiques (sujets 311, 320, 303), 
ou combinées avec des problèmes dans l’activation des unités lexicales par le 
biais de ces codes phonémiques (sujets 333,305, 315,....). 

Enfin, le dernier groupe (cf. Annexe 6) concerne les sujets qui ont des 
difficultés à tous les niveaux (25 %). Là encore, il existe une diversité au sein 
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de ce groupe entre des personnes qui présentent des difficultés massives dès 
l’activation des codes graphémiques (par exemple le sujet 327) et des person¬ 
nes qui présentent des difficultés qui semblent moins importantes (par exem¬ 
ple le sujet 233). 

A partir de ces premières analyses, il apparaît possible de mettre en 
évidence des difficultés différentes d’un «mauvais» lecteur à l’autre; il con¬ 
vient toutefois de préciser que les analyses rapportées ici n’ont pris en compte 
que les coûts moyens pour les épreuves. Les profils pourront donc être affinés 
par la prise en compte d’autres informations comme le taux d’erreurs et les ef¬ 
fets associés aux variables manipulées dans chaque épreuve. 

Le taux d’erreurs peut venir confirmer une difficulté observée à partir 
des mesures chronométriques, en signalant que la mise en oeuvre des proces¬ 
sus est non seulement coûteuse mais aussi inefficace dans la mesure où elle 
conduit fréquemment à un échec. Le taux d’erreurs peut également mettre en 
évidence une stratégie non observable à partir des temps de réaction, le sujet 
pouvant privilégier la rapidité des réponses au dépend de leur précision 
(speed-accuracy trade-off). 

En ce qui concerne les variables manipulées, l’étude des effets obser¬ 
vés en fonction des caractéristiques du matériel devrait permettre d’approfon¬ 
dir et de spécifier l’origine des difficultés. Par exemple, un effet de longueur 
en décision lexicale permet de penser que le sujet effectue l’analyse des mots 
de façon sérielle ce qui n’est pas le cas pour le lecteur habile. 

En apportant de nouvelles techniques, de nouvelles conceptions, la 
psychologie cognitive est en mesure d’aider le formateur (en formation initiale 
ou continue) à mieux appréhender les problèmes qui peuvent se poser à tel 
ou tel apprenant au cours de sa formation. Cependant l’utilisation d’outils 
d’évaluation existant ou la construction d’outils de remédiation adaptés aux 
difficultés observées passe, pour être pleinement satisfaisante, par un inves¬ 
tissement important et une appropriation de la démarche en psychologie co¬ 
gnitive. 
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Annexe 1 

Exemples de matériel utilisé dans chacune des épreuves en fonction des étapes testées 

1. Étape de traitement visuel 

7.7. Codage abstrait des lettres (COD) 

[Stimulus] A z A a LL 

[Consigne] " Les 2 lettres sont-elles identiques ? " 

[Réponse] NON OUI OUI 

7.2. Jugement d'identité de lettres (JIL) 

[S] AAA ABA AAAAAAAAAAB 

[C] "Toutes les lettres sont-elles identiques ?" 

[R] OUI NON NON 

1.3. Jugement de similitude : suite de lettres non-prononçable (SMI) 

[S] ACFDX ACFDX BCDTF BCDTG 

[C] " Les 2 suites sont-elles identiques ? " 

[R] OUI NON 

7.4. Jugement de similitude: suite de lettres prononçable (SM2) 

[S] ACFDX ACFDX BCDTF BCDTG 

[C] " Les 2 suites sont-elles identiques ? “ 

[R] OUI NON 

2. Étape de traitement phonologique 

2.7. Décision phonologique t choix forcé avec deux non-mots (PHI) 

[S] aumir romau 

eaumir romou 

[C] "Les deux items se prononcent-ils de la même manière?" 

[R] OUI NON 

2.2. Décision phonologique t choix forcé avec un mot et un non-mot (PH2) 

[S] aumir romau 

eaumir romou 

[C] " Les deux items se prononcent-ils de la même manière? " 

[R] OUI NON 

2.3. Décision lexicale phonologique (PHO) 

[S] phoule romau 

[C] "Le stimulus se prononce-t-il comme un mot de la langue ?" 

[R] OUI NON 

3. Étape de traitement lexical 

3.1. Décision lexicale (DL 7, DL2, DL3) 

[S] bijou carrosse typrfg 

[C] "Le stimulus est-il un mot de la langue ? 

[R] OUI OUI NON 

3.2. Amorçage orthographique (AOR) 

[A] CANARD -— natte 

[S] canard étain talin 

[C] "Le stimulus est-il un mot de la langue ? 

[R] OUI OUI NON 

3.3. Catégorisation sémantique (SEM) 

[S] ANIMAL ANIMAL POISSON 

chien pieuvre baleine 

[C] " Le second item appartient-il t la même catégorie que le premier ? " 

[R] OUI OUI NON NON 


trapoue 

NON 


POISSON 

chien 




Évaluer les difficultés de lecture chez l'adulte 127 


Annexe 2 

Comparaison de moyennes pour les coûts associés aux épreuves testant les étapes visuelle, 
phonologique et lexicale et pour les vitesses de lecture. 

Letestz [z = {m l -m 2 )/+ (j|/« 2 )] permet de comparer des moyennes dans 
le cas de grands échantillons (>30 sujets). 


Comparaison 

Groupe 1 vs Groupe 2 

Groupe2 vs Grou 

COD 

z = 2.91 * 

z = .83 ns 

JIL 

z = 5.57** 

z = 2.11 * 

SMI 

z = 3.95** 

z = .2.45* 

SM2 

z = 5.74** 

z = 2.44* 

PHO 

z = 6.29** 

z = 1.41 ns 

PHI 

z = 6.03** 

z = 3.30** 

PH 2 

z = 6.57** 

z = 1.96* 

DL1 

z = 6.24** 

z = 2.14* 

DL2 

z = 4.88** 

z = 2.12* 

DL3 

z = 3.16** 

z = 1.72* 

SEM 

z = 5.32** 

z = 2.04* 

LMM 

z = 5.98** 

z = 4.29** 

LHC 

z = 6.02** 

z = 4.83** 


* p < .05 (z = 1.645) 

** p< .01 (z = 2.325) 
ns: non significatif 
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Annexe 3 


Matrices de corrélations entre les coûts associés aux différentes épreuves pour les trois groupes. 

Groupe 1 



COD 

JIL 

SMI 

SM2 

PHO 

PHI 

PH2 

DL1 

DL 2 

DL3 

COD 

1 










JIL 

.34* 

1 









SMI 

.09 

.45** 

1 








SM2 

.36** 

.56** 

.59** 

1 







PHO 

.24 

.43** 

.44** 

.67** 

1 






PHI 

.35** 

. 68 ** 

.54** 

.73** 

.65** 

1 





PH2 

.26* 

.49** 

.54** 

.80** 

. 68 ** 

.71** 

1 




DL1 

.49** 

.43** 

.30* 

.54** 

.56** 

.58** 

.56** 

1 



DL2 

.52** 

.41** 

.23 

.61** 

.54** 

44 ** 

. 66 ** 

.61** 

1 


DL3 

.25* 

.45** 

.27* 

.45** 

.59** 

.42** 

.48** 

.54** 

.46** 

1 

SEM 

.21 

.36** 

.39** 

.54** 

.62** 

.59** 

.69** 

.50** 

.40** 

.45** 

Groupe 2 











COD 

JIL 

SMI 

SM2 

PHO 

PHI 

PH 2 

DL1 

DL 2 

DL3 

COD 

1 










JIL 

.49* 

1 









SMI 

.18 

.53** 

1 








SM2 

.46** 

.70** 

.49** 

1 







PHO 

.11 

.32* 

.44** 

.47** 

1 






PHI 

.31* 

.60** 

.58** 

.80** 

.57** 

1 





PH2 

.33** 

.53** 

.55** 

.71** 

.82** 

.83** 

1 




DL1 

.50** 

.47** 

.32* 

.70** 

.61** 

. 66 ** 

.63** 

1 



DL2 

.46** 

.49** 

.32* 

.58** 

.53** 

.55** 

.71** 

.76** 

1 


DL3 

.44* 

.42** 

.25* 

.31* 

.43** 

.33** 

.51** 

.55** 

.62** 

1 

SEM 

.25* 

.29* 

.23 

.35** 

.72** 

.41** 

.60** 

. 66 ** 

.55** 

.41** 

Groupe 3 











COD 

JIL 

SMI 

SM2 

PHO 

PHI 

PH2 

DL1 

DL2 

DL3 

COD 

1 










JIL 

.36* 

1 









SMI 

.04 

.56** 

1 








SM2 

.20 

. 66 ** 

.70** 

1 







PHO 

.26 

-.19 

-.10 

-.14 

1 






PHI 

.11 

.57** 

.76** 

. 86 ** 

-.07 

1 





PH2 

.05 

.33 

.72** 

.78** 

-.08 

. 86 ** 

1 




DL1 

.01 

.14 

.36* 

.69** 

-.14 

.73** 

.76** 

1 



DL 2 

.12 

.31 

.45** 

.69** 

-.11 

.61** 

.72** 

.80** 

1 


DL3 

-.01 

.11 

.33* 

.55** 

-.06 

.73** 

.77** 

.87** 

.65** 

1 

SEM 

.05 

.24 

.41* 

.70** 

-.26 

. 66 ** 

.82** 

.81** 

.65** 

.74** 


Note :*p<.05, **p<.01 
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Annexe 4 





Sujets présentant une difficulté au niveau d'une seule étape 



Sujets 

COD 

JIL SMI SM2 PHO PHI PH2 DL1 DL2 DL3 SEM LMM 

LHC 

Diff 

203 

+ 



V 

307 

+ 

+ 


V 

355 

+ 



V 

207 

+ 

+ + 

+ 

V 

228 


+ + 

+ 

V 

337 


+ + 

+ 

V 

208 


+ + + 

+ 

V 

330 


+ 


V 

257 


er 


V 

239 


+ 


V 

251 


+ 


V 

261 


+ 


V 

322 


+ 


V 

334 


+ + 

+ 

V 

336 


+ + 

+ 

V 

319 


+ 


V 

236 


+ 


L 

205 


+ + 


L 

227 


+ 


L 

230 


er 


P 

264 


+ 


P 

312 


+ 


P 

321 


+ 


P 

309 


er 


P 

Note ; V 

+ 

= difficulté(s) visuelle(s), P = difficulté^) phonologique(s), L = difficulté^) lexicale(s) 

= difficulté^) sur le coût de l'épreuve, er = difficuité(s) sur l'exactitude 
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Annexe 5 

Sujets présentant une difficulté au niveau de deux étapes 


Sujets 

COD 

JIL 

SMI SM2 PHO PHI PH2 DL1 DL2 DL3 SEM 

LMM 

LHC 

Diff 

203 

+ 





V 

307 

+ 



+ 


V 

355 

+ 





V 

207 

+ 


+ 

+ 

+ 

V 

228 


+ 

+ 


+ 

V 

337 


+ 

+ 


+ 

V 

208 



+ + 

+ 

+ 

V 

330 


+ 




V 

257 



er 



V 

239 



+ 



V 

251 



+ 



V 

261 



+ 



V 

322 



+ 



V 

334 



+ 

+ 

+ 

V 

336 



+ 

+ 

+ 

V 

319 



+ 



V 

236 



+ 



L 

205 



+ 

+ 


L 

227 



+ 



L 

230 



er 



P 

264 



+ 



P 

312 



+ 



P 

321 



+ 



P 

309 



er 



P 

Note : V 

= difficulté(s) visuelle(s), P = difficulté(s) phonologique(s), L = difficultés) iexicale(s) 





+ = difficultés) sur le coût de l'épreuve, er = difficulté(s) sur l'exactitude 
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Annexe 6 

Sujets présentant une difficulté au niveau de trois étape 


Sujets 

COD 

JIL 

SMI 

SM2 

PHO 

PHI 

PH2 

DL1 

DL2 

DL3 

SEM 

LMM 

LHC 

Diff 














★ 

327 

+ 

+ 

+ 

+ 

er 

+ 

er 

+ 

+ 

+ 

er 

+ 

+ 

VPL 

214 

+ 

+ 

+ 

+ 

er 

+ 

+ 

+ 

+ 

+ 



+ 

VPL 

338 

+ 

+ 

+ 

+ 

er 

+ 

er 

+ 

+ 


+ 

+ 

+ 

VPL 

326 

+ 

+ 

+ 

+ 

+ 

+ 

+ 


+ 


+ 

+ 

+ 

VPL 

335 

+ 

+ 

+ 

+ 

+ 

+ 

+ 


+ 


+ 

+ 

+ 

VPL 

232 

+ 

+ 

+ 

+ 

+ 


+ 

+ 

+ 


+ 


+ 

VPL 

250 

+ 

+ 

er 

+ 

+ 

+ 

+ 




+ 

+ 


VPL 

310 

+ 


+ 

+ 

+ 

+ 

+ 

+ 



+ 



VPL 

209 

+ 

+ 


+ 

er 

er 

er 

+ 



+ 

+ 

+ 

VPL 

331 


+ 

+ 

+ 

er 

+ 

er 

+ 

+ 

+ 

+ 

+ 

+ 

VPL 

302 



+ 

+ 

+ 

+ 

+ 

+ 

er 

+ 

+ 

+ 

+ 

VPL 

202 



+ 

+ 

+ 

+ 

+ 

+ 

er 





VPL 

245 



+ 


+ 

+ 

+ 




+ 

+ 

+ 

VPL 

329 



+ 

+ 

+ 


+ 

+ 

+ 


+ 

+ 

+ 

VPL 

306 



+ 


+ 

+ 

+ 


+ 



+ 

+ 

VPL 

233 



+ 


+ 






+ 



VPL 


Sujets ne présentant aucune difficulté au niveau des trois étapes 

221 + + 

243 + + 

Note : VPL = difficuité(s) visuelle(s), phonologique(s) et lexicale(s) 

+ = difficulté(s) sur le coût de l’épreuve, er = difficulté(s) sur l'exactitude 
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Introduction 

«Faire parler» l’ordinateur pour améliorer la lecture chez l’enfant qui 
apprend à lire constitue aujourd’hui un champ particulièrement novateur 
d’application des recherches de psychologie cognitive. Cette nouvelle démar¬ 
che repose en fait sur une réalité solidement ancrée dans les pratiques 
pédagogiques : le rôle de la communication orale comme support de la trans¬ 
mission des savoirs. 

De l’ordinateur simplement calculateur, nous sommes passés à 1ère 
du multimédia où l’ordinateur est à la fois lecteur (reconnaissance de caractè¬ 
res), interlocuteur (production de la parole) et auditeur (reconnaissance de 
la parole). Cette véritable mutation technologique que nous vivons produit 
elle-même une double mutation. Mutation pédagogique d’abord, où la psycho¬ 
logie cognitive tient un rôle majeur en fournissant aux professionnels de l’en¬ 
seignement et de la formation des modèles d’apprentissage et d’expertise que 
ceux-ci doivent s’approprier. Mutation sociale également car de nouveaux 
comportements d’apprentissage voient le jour. Leong (1992b) affirme que ces 
nouveaux comportements «restructurent notre fonctionnement mental et 
réorganisent des habiletés cognitives de haut niveau» (p.95). 

De nombreux chercheurs, travaillant dans le domaine de l’enseigne¬ 
ment assisté par ordinateur, invitent les enseignants à faire utiliser les ordina¬ 
teurs par les enfants non pas comme un outil de travail mais comme un objet 
de pensée. Nous ne sommes pas loin des conceptions de Piaget : l’ordinateur, 
dans les classes, peut permettre à l’enfant d’être le bâtisseur de ses propres 
structures intellectuelles grâce à la médiatisation qu’il peut exercer entre le 
langage et le développement cognitif. 

L’enjeu de la mise au point de systèmes d’aide à la lecture assisté par 
ordinateur est considérable. Comme le souligne Haton (1992), il s’agit en effet 
de faire bénéficier l’enseignement des nouvelles techniques informatiques 
tout en brisant le rôle central et dirigiste de la machine et la rigidité de ses 
échanges avec l’apprenant. Il s’agit d’introduire de la souplesse, favoriser une 
progression et même une démarche individualisée, sanctionner à bon escient. 
En un mot, il faut repenser l’image de «l’ordinateur tuteur» à travers les nou¬ 
veaux moyens que le multimédia nous offre *. 

Le présent travail se limite à un objectif précis. Il présente les résultats 
de recherches (essentiellement anglo-saxonnes) qui ont créées et testées des 
systèmes de rétroaction verbale pour améliorer, d’une façon générale, les ha¬ 
biletés de reconnaissance des mots chez des enfants présentant, à des degrés 
plus ou moins sévères, des difficultés d’apprentissage. Ces systèmes, pour la 
plupart, utilisent la parole de synthèse comme rétroaction sonore 1 2 . Bien que 


1 Voir de La Passardière et Baron (1991) pour des exemples d’applications de ces technolo¬ 
gies nouvelles. 

2 Pour une perspective plus didactique, le lecteur pourra utilement se reporter à l’ouvrage de 
Cohen (1992) qui fait part de plusieurs travaux français sur l’utilisation de la synthèse vocale 
dans l’apprentissage et le perfectionnement de la langue écrite. 
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les recherches soient encore très restreintes et les résultats tangibles peu 
nombreux, nous considérons qu’il est utile d’établir un premier bilan car nous 
pensons que ce champ d’étude est fructueux. Deux raisons ont guidé notre 
choix. 


La première est liée à la place de plus en plus importante que tient la 
psychologie cognitive dans le domaine de l’éducation : elle a apporté en effet 
de puissants concepts et modélisations de l’acquisition et du développement 
du savoir. On assiste peut-être, depuis les années 1980, au développement 
d’une nouvelle discipline qui tend à émerger essentiellement des recherches 
sur la lecture. Cette nouvelle discipline, que l’on pourrait nommer les sciences 
cognitives appliquées à l’éducation , contribue en particulier à l’élaboration 
d’outils d’évaluation et de remédiation capables d’aider les enseignants et les 
formateurs dans leur tâche 3 . Les systèmes d’aide aux apprentissages se sont 
en effet considérablement développés; aujourd’hui, certains systèmes, dits ex¬ 
perts, utilisent des techniques très pointues de modélisation des connaissan¬ 
ces et de stockage des actions des utilisateurs. La rétroaction verbale est à 
l’heure actuelle une sophistication particulière de ces systèmes d’aide; elle 
s’inscrit donc dans un champ déjà très vaste et particulièrement important 
pour les professionnels de l’enseignement. 

La seconde raison est liée à la difficulté des chercheurs à transférer les 
résultats de leurs recherches dans le domaine de l’enseignement. Il faut recon¬ 
naître qu’il existe encore des «résistances» quant à l’utilisation de tels systè¬ 
mes (en particulier ceux qui concernent l’évaluation et la remédiation des 
capacités cognitives). Pour utiliser un terme qui fait souvent partie du voca¬ 
bulaire des détracteurs de ces outils (détracteurs qui, bien souvent, ne sont 
pas directement impliqués dans le difficile problème de la transmission des sa¬ 
voirs), le domaine de l’éducation doit faire le deuil de plusieurs concepts ar¬ 
chaïques qui ont longtemps prévalus pour expliquer de façon exclusive les 
difficultés d’apprentissage -en particulier l’importance des facteurs dits socio- 
affectifs-; concepts dont l’apparente richesse sémantique masque bien sou¬ 
vent le caractère superficiel et fallacieux des explications avancées. Les résul¬ 
tats des travaux de psychologie cognitive nous conduisent à centrer notre 
curiosité sur les mécanismes d’acquisition et de transmission du savoir tout en 
gardant à l’esprit le rôle important, d’une part, des représentations mentales, 
qu’il convient d’analyser en dehors de conceptions neuro-biologique ou socio¬ 
culturelle; et, d’autre part, de la psychologie dite computationnelle et des or¬ 
dinateurs dans la modélisation de la pensée humaine 4 . 

Les objectifs de ce travail s’inscrivent donc dans cette logique. A tra¬ 
vers le thème abordé, ü s’agit pour nous d’illustrer comment la psychologie co- 


3 Cfr. pour le problème de l’illettrisme, le logiciel d’Evaluation-Diagnostic des Capacités Cogni¬ 
tives en Lecture pour Adultes ( ECCLA ; Zagar, Jourdain & Lété, 1993). 

4 Voir Leong (1993) pour une discussion du rôle de la psychologie cognitive dans le domaine 
de l’éducation et Gardner (1985) pour un point de vue plus général sur le développement de la 
psychologie cognitive. 
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gnitive a profondément modifié la façon d’appréhender les difficultés 
d’apprentissage (ici les difficultés de lecture). En s’appuyant sur des modèles 
issus de la recherche fondamentale, les chercheurs ont pu élaborer des outils 
d’évaluation et de remédiation qui ne sont pas a-théoriques, comme cela est 
encore trop souvent le cas aujourd’hui. 

Après avoir montré l’importance de l’efficacité des traitements phono¬ 
logiques dans l’apprentissage de la lecture et décrit quels peuvent être les ef¬ 
fets de la rétroaction verbale sur leurs déficits, nous décrivons quelques 
aspects techniques de la production de la parole sur ordinateur. Etant donné 
que la plupart des systèmes, dans les recherches présentées ici, utilisent de la 
parole de synthèse, nous abordons le problème de sa compréhension. Nous 
présentons alors les recherches les plus récentes, essentiellement en langue 
anglaise, qui ont été menées, d’une part, pour améliorer le décodage et la re¬ 
connaissance des mots et, d’autre part, pour améliorer la compréhension. 

1. LA RÉTROACTION VERBALE ET SES EFFETS 
SUR LES TRAITEMENTS PHONOLOGIQUES 


De nombreux travaux rendent compte de l’importance des traite¬ 
ments phonologiques pour apprendre à lire dans un système alphabétique. 
Wagner et Torgesen (1987) recensent trois habiletés liées au traitement pho¬ 
nologique de la langue susceptibles d’avoir un rôle causal dans l’acquisition de 
la lecture. 

La première, la conscience phonologique, est la capacité à identifier 
les composants phonologiques des unités linguistiques et à les manipuler de 
façon intentionnelle (cf. Gombert, 1990 5 ). Elle est généralement appréhen¬ 
dée dans des tâches de segmentation de mots en phonèmes, en syllabes ou en 
unités subsyllabiques (attaque-rime 6 par exemple). Avec l’apprentissage de la 
lecture, la performance des enfants à ce type de tâche évolue très 
rapidement : si les lecteurs débutants échouent à segmenter les mots en pho¬ 
nèmes, ils réussissent par contre à la segmentation en syllabes (Wise, Oison & 
Treiman, 1990). 

La seconde, le décodage, est la capacité à relier les unités du langage 
parlé (les phonèmes) aux unités du langage écrit (les graphèmes) pour accé¬ 
der au lexique mental. Le rôle du décodage dans les difficultés de lecture reste 
controversé; il apparaît cependant que, lors de l’accès au lexique, il est utilisé 
par tous les lecteurs en fonction de la familiarité du mot lu et qu’il est très im¬ 
portant dans les premières étapes de l’acquisition de la lecture. Pour Olofsson 
(1992), les problèmes du décodage ont une incidence à la fois sur la compré- 


5 Gombert (1990) utilise le terme de «capacité métaphonologique». 

6 La syllabe peut être décomposée en deux parties : l’attaque qui correspond au groupe de 
consonne(s) initiale(s) et la rime qui correspond au(x) phonème(s) qui suivent. Par exemple, 
l’attaque du mot front est /fr/, la rime étant /ont/. 
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hension et sur la pratique de la lecture. Si le décodage est déficient, l’informa- 
tion est traitée par d’autres moyens, en particulier par une utilisation 
anormale du contexte. Le fait que les enfants mauvais compreneurs ont inva¬ 
riablement une habileté médiocre dans la reconnaissance des mots mais mon¬ 
trent d’importants effets du contexte linguistique dans de nombreuses tâches 
a longtemps été un paradoxe relevé dans la littérature sur les difficultés de 
lecture; paradoxe qui était lui-même en contradiction avec certaines théories 
développementales (Smith, 1971). Il a été expliqué par Stanovich (1980) de 
la façon suivante : le manque d’efficacité des processus de reconnaissance des 
mots chez les mauvais lecteurs les force à mobiliser leurs ressources atten- 
tionnelles sur des mécanismes contextuels ce qui diminue leurs ressources 
disponibles pour des processus de plus haut niveau (la compréhension). A 
l’opposé, l’efficacité des mécanismes de reconnaissance des mots des bons 
lecteurs ne nécessite pas de ressources attentionnelles, celles-ci peuvent dès 
lors être déléguées vers la compréhension. Les difficultés du décodage provo¬ 
quent également un désintérêt pour la lecture. La probabilité de rencontrer 
des mots nouveaux diminue limitant ainsi le développement du vocabulaire. 
Le désintérêt engendre lui-même moins de pratique, c’est à dire moins d’ex¬ 
périence avec l’écrit, alors que celle-ci est fondamentale à l’acquisition d’un 
lexique orthographique qui permet une reconnaissance rapide et efficace des 
mots (Cunningham & Stanovich, 1990; Stanovich & West, 1989). 

La dernière enfin, le recodage phonétique en mémoire de travail, est 
la capacité à maintenir activés les sons précédemment décodés de façon à les 
assembler pour former un mot. Un recodage efficace de l’information phono¬ 
logique en mémoire de travail permet au lecteur d’allouer un maximum de res¬ 
sources cognitives à l’association des phonèmes. Les bons et les mauvais 
lecteurs diffèrent en effet dans des tâches d’empan mémoriel, ces différences 
dérivant vraisemblablement de l’inefficacité du recodage phonétique en mé¬ 
moire de travail. 

Un moyen de compenser les difficultés du traitement phonologique 
est d’utiliser un ordinateur capable de prononcer les mots qui posent problè¬ 
me, ceci à la demande de l’utilisateur. Quelles sont les attentes que l’on peut 
formuler relativement à l’utilisation d’un tel système ? 

Un système de rétroaction verbale peut en premier lieu être efficace 
pour permettre à l’enfant de corriger ses erreurs ou pour vérifier l’exactitude 
du décodage préalablement effectué. Si une erreur n’est pas identifiée, com¬ 
me cela est souvent le cas en lecture silencieuse en classe, la mauvaise asso¬ 
ciation graphème-phonème est renforcée. Cette association incorrecte peut 
par la suite interférer en mémoire avec d’autres relations rencontrées dans 
des mots orthographiquement similaires. Jorm et Share (1983) avancent que 
l’habileté à décoder correctement les mots fonctionne comme un mécanisme 
d’auto-enseignement, chaque identification correcte d’un mot constituant un 
apprentissage réussi qui mène à l’identification du mot à travers la voie direc¬ 
te. Il est en effet indiscutable qu’un enfant dont les traitements phonologiques 
sont efficaces développe un riche lexique orthographique : des opérations 
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réussies de décodage amènent à apparier des représentations phonologiques 
avec des représentations orthographiques ce qui permet un accès rapide au 
lexique mental. 

Une rétroaction verbale peut également alléger la charge en mémoire 
de travail : les phonèmes peuvent être en effet correctement choisis, mais une 
capacité limitée de traitement peut empêcher que ceux-ci soient correcte¬ 
ment assemblés. L’allégement de la charge en mémoire de travail produit de 
plus un meilleur stockage des mots : les connexions entre les sons et les let¬ 
tres se trouvent renforcées ce qui facilite l’apprentissage de mots nouveaux 
par analogie avec des mots plus familiers (Ehri & Robbins, 1992). 

La rétroaction verbale peut enfin développer certaines habiletés mé- 
tacognitives. En effet, de façon à utiliser efficacement le système, le lecteur 
doit être conscient de la nécessité de demander ou non de l’aide; il doit donc 
être capable d’évaluer à tout moment le niveau de sa compréhension. Olofsson 
(1992, exp.l) étudie, chez des enfants de 81/2 ans, ce comportement de de¬ 
mande d’aide et l’auto-évaluation de leur compréhension. Les enfants lisent 
des textes soit sur papier soit sur écran d’ordinateur. Dans cette dernière con¬ 
dition, le lecteur peut pointer la souris sur un mot pour demander une rétroac¬ 
tion verbale : le mot est alors mis en surbrillance et prononcé rapidement. 
Après chaque texte, les enfants sont soumis à des questions de compréhen¬ 
sion et, à la fin de la passation, à un questionnaire d’auto-évaluation. Les ré¬ 
sultats montrent que les sujets demandent une rétroaction verbale pour des 
mots qui sont susceptibles de leur causer des difficultés de compréhension : 
les mots demandés sont généralement longs, irréguliers et de fréquence lexi¬ 
cale basse dans la langue. Il n’existe pas de différence au niveau de la compré¬ 
hension des textes entre les deux groupes. Par contre, les sujets du groupe 
rétroaction verbale jugent leur compréhension à un niveau plus élevé que les 
sujets de l’autre groupe. Ces résultats sont en accord avec d’autres recherches 
étudiant, de façon plus générale, l’effet d’une rétroaction présentée sur ordi¬ 
nateur (feedback correctif). Par exemple, Zakay (1992) montre qu’une ré¬ 
troaction sur ordinateur améliore le jugement qu’un individu peut avoir sur 
ses connaissances : la rétroaction permet de confirmer immédiatement les 
bonnes réponses ou de corriger les réponses erronées. Le fait que l’ordinateur 
produise la rétroaction permettrait à l’utilisateur, au contraire d’une interac¬ 
tion avec un adulte, de demander de l’aide sans retenue pour tester intention¬ 
nellement son savoir. Les ordinateurs sont en effet généralement perçus par 
les individus comme objectifs et moins embarrassants lors de l’émission d’une 
erreur. Les individus sont donc plus enclins à demander de l’aide à un ordina¬ 
teur qu’à une personne (Kluger & Adler, 1993). 

La rétroaction verbale peut donc faciliter les traitements phonologi¬ 
ques en améliorant le décodage et en fournissant ainsi à l’élève la possibilité 
de déléguer toute son attention à la compréhension. Une conséquence impor¬ 
tante est que les élèves peuvent lire au-dessus de leur niveau en lecture. Les 
sujets testés par Olofsson (1992, exp.2) rapportent par exemple qu’ils lisent 
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davantage depuis leur entraînement et qu’ils sont moins effrayés pour lire des 
textes difficiles. 


2. LA PRODUCTION DE LA PAROLE 

SUR ORDINATEUR 

2.1 Données techniques 

Il existe deux techniques pour restituer du son à partir de l’ordi¬ 
nateur : la numérisation et la synthèse du son. 

La numérisation du son consiste à reproduire des sons enregistrés sur 
un support analogique ou par un microphone. Le signal électrique du son 
(produit par les vibrations de la membrane du microphone par exemple) est 
codé en une suite de valeurs numériques après avoir été découpé à des inter¬ 
valles de temps réguliers (échantillonnage). Le son numérisé est alors stocké 
sur support informatique (disque dur, CD-ROM). La restitution du son néces¬ 
site que les opérations inverses soient effectuées : les données numériques 
sont converties en variations d’un signal électrique transmis, après amplifica¬ 
tion, à un haut parleur. Cette technique restitue la parole à la perfection; elle 
est de plus parfaitement compréhensible. Cependant, elle comporte un 
inconvénient : la très grande taille des fichiers de stockage doit être compen¬ 
sée par une vitesse rapide d’accès au disque dur pour que le délai entre la de¬ 
mande de rétroaction verbale et la production du son ne soit pas trop 
important. McConkie et Zola (1985) (cité in Farmer, Klein & Bryson, 1992) 
montrent à cet effet que, une fois que les mots ont été sélectionnés pour une 
rétroaction, le temps de recherche du mot peut varier de 500 ms à 10 secon¬ 
des selon les mots. Selon les auteurs, cet intervalle peut décourager les lec¬ 
teurs et réduire ainsi la portée du système. 

La plupart des équipes de recherche utilisent un système de synthèse 
de textes. Le signal vocal est créé à partir de chaînes de caractères ASCII à 
l’aide d’un dictionnaire d’éléments acoustiques minimaux enregistrés et nu¬ 
mérisés au préalable. Ce dictionnaire contient l’information phonologique et 
morphologique des items lexicaux ainsi que des données syntaxiques, séman¬ 
tiques et pragmatiques du discours. Une des meilleures méthodes de trans¬ 
cription est une synthèse par diphones 7 . Cette méthode permet de traiter le 
difficile problème de coarticulation entre phonèmes. Un diphone est une réa¬ 
lisation acoustique qui s’étend de la zone stable d’un phonème à la zone stable 
du phonème suivant. On en compte 1200 en français d’une durée moyenne de 
100 ms. L’enchaînement des diphones est produit en temps réel grâce à des 


7 Cette méthode a été développée en France par le Centre National d'Etudes des Télécommu¬ 
nications (CNET). Deux systèmes importants ont été commercialisés sous licence CNET en 
France : le système Ferma F5000 et le système Televox (cf. Cohen, 1992, pour des exemples 
d’utilisation). 
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logiciels de transcription fonctionnant en arrière plan : la production du son 
est donc quasi instantanée. Cette méthode permet enfin de produire certaines 
caractéristiques suprasegmentales du texte lu : rythme, intonation, pause... 
Par exemple, le Ferma F5000 prononce différemment une phrase en fonction 
de la ponctuation du texte (« non /», «non ?»), résout certaines ambiguïtés de 
prononciation («tes poules du couvent couvent ») grâce à des règles d’ana¬ 
lyse syntaxique et connaît la prononciation de mots irréguliers (« oignon », 
<< femme »). 

Le système largement utilisé dans les travaux rapportés ci-après est 
DECtalk développé à partir des recherches du Massachusetts Institute of 
Technology par Digital Equipment Corporation 8 . DECtalk est utilisé aux 
USA par l’équipe de Wise, Oison et collaborateurs et au Canada par Leong. 
Dans les pays Scandinaves, une variante muti-langue de DECtalk -InfoVox- 
est utilisée notamment par Olofsson. 

2.2 La compréhension de la parole de synthèse 9 

La perception de la parole de synthèse diffère de celle de la parole hu¬ 
maine par son insuffisance de prosodie (intonation, hauteur mélodique, durée 
de la parole) qui est la conséquence des routines stéréotypées d’articulation 
utilisées pour segmenter le message. De plus, dans le langage naturel, les dis¬ 
tinctions entre les phonèmes sont spécifiées relativement à certaines données 
acoustiques fournies par les organes de la parole (par exemple, le timbre 
d’une voyelle est donnée relativement à la position de la langue et des lèvres 
et par le degré d’ouverture de la bouche). Ces données acoustiques sont im¬ 
plémentées en nombre limité dans la parole de synthèse ce qui produit une 
perte d’information non négligeable. Une conséquence importante est que les 
auditeurs compenseraient les défauts du signal en s’appuyant massivement 
sur le contexte pour accélérer la reconnaissance des mots, se trouvant ainsi 
dans la même situation qu’un lecteur ayant des difficultés de décodage (cf. su¬ 
pra Stanovich, 1980). Il convient donc de rechercher si, relativement à la pa¬ 
role normale, les traitements cognitifs de perception et de compréhension de 
la parole de synthèse sont affectés et modifiés par les caractéristiques du si¬ 
gnal. 

De nombreux résultats montrent effectivement que ces caractéristi¬ 
ques suscitent un coût cognitif supplémentaire; coût qui n’est apparent que si 
on utilise des mesures appropriées pour le mesurer. Une première mesure est 
l’exactitude des identifications ou l’intelligibilité du système 10 . Bien que l’in¬ 
telligibilité du son restitué soit inférieure à celle de la parole enregistrée, il est 


8 Pour une description détaillée du système, voir Bruckert, Minow & Tetschener (1983) et 
Klatt (1987). Voir également Venezky et Suraj (1993) qui présentent de nouveaux algorithmes 
pour présenter des mots en syllabes et les faire prononcer une par une par DECtalk. 

9 Voir Duffy et Pisoni (1992) pour une synthèse détaillée de cette problématique. 

10 Cette mesure est généralement appréhendée en demandant à des sujets de reconnaître un 
mot parmi plusieurs proposés après qu’ils aient été prononcés par le synthétiseur. 
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avéré que la plupart des systèmes de synthèse du son permettent une identi¬ 
fication acceptable des mots de la langue. On peut noter cependant que ce pa¬ 
ramètre varie considérablement en fonction du système utilisé (de 3% à 36% 
d’erreurs chez Logan, Greene & Pisoni (1989) qui comparent 10 systèmes en 
langue anglaise auprès d’adultes). DECtalk, dans sa version Perfect Paul, est 
le système le plus intelligible à l’heure actuelle. Oison, Foltz et Wise (1986) ont 
testé DECtalk auprès d’enfants et d’adultes. Un groupe de mauvais lecteurs 
répètent correctement 95% des 120 mots prononcés hors contexte par DEC¬ 
talk et un groupe de sujets adultes répètent correctement 96% (respective¬ 
ment, leur pourcentage est de 98% et 96% pour des mots préalablement 
enregistrés). Selon les auteurs, l’intelligibilité du système est suffisante pour 
permettre une rétroaction verbale de mots en contexte 11 . 

Le principal inconvénient de la parole de synthèse provient du fait 
qu’elle augmente le temps d’identification des mots. Pisoni (1981) utilise une 
tâche de décision lexicale et compare les temps de réactions obtenus pour des 
mots et des non-mots présentés auditivement à partir soit de la parole enre¬ 
gistrée soit de la parle synthétisée. Les résultats font apparaître que le temps 
pour décider du statut lexical du mot augmente avec de la parole synthétisée 
(de 153 ms pour les mots et de 133 ms pour les non-mots). L’absence d’inte¬ 
raction entre les deux facteurs laisse penser que le surcoût temporel est im¬ 
putable à l’identification des phonèmes plus qu’à l’identification d’une entrée 
lexicale dans le lexique mental. Une étude de Manous et Pisoni (1984) indique 
de plus que les auditeurs doivent entendre plus de phonèmes pour identifier 
correctement un mot prononcé avec un système de synthèse. Les sujets écou¬ 
tent successivement les 50,100,150 premières millisecondes d’un mot jusqu’à 
ce qu’il soit complètement présenté. Après chaque présentation, les sujets 
doivent noter le mot qu’ils pensent avoir reconnu. Les résultats indiquent que, 
quand le mot a été synthétisé (ici par DECtalk ), les sujets ont besoin d’une 
durée de présentation de 417 ms en moyenne alors que cette durée minimale 
est de 361 ms quand le mot a été enregistré. 

Il apparaît enfin que le traitement de la parole de synthèse, même si 
elle est clairement intelligible, nécessite plus de ressources cognitives en mé¬ 
moire de travail que la parole humaine. Smither (1993) demande à ses sujets 
d’écrire plusieurs suites de huit chiffres après qu’elles aient été présentées 
auditivement soit par l’intermédiaire d’un système de synthèse soit par un ma¬ 
gnétophone. L’intelligibilité du système a été précédemment testée auprès 
d’autres sujets qui ont reporté avec exactitude près de 99% des chiffres pro¬ 
noncés par le système. Les résultats font apparaître que les sujets réussissent 
mieux quand la parole est enregistrée que lorsqu’elle est synthétisée. 

Il convient cependant de relativiser ces inconvénients car leurs effets 
sont atténués si l’utilisateur a suffisamment de pratique avec le système 
(Greenspan & al., 1988; Schwab, Nusbaum & Pisoni, 1985). Les résultats de 


11 D'autres tests auprès d’adultes dorment sensiblement les mêmes résultats (Greene, Logan & 
Pisoni, 1986; Greenspan, Nusbaum, & Pisoni, 1988). 
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ces études font apparaître qu’avec la pratique (10 heures en moyenne), les 
utilisateurs améliorent leur habileté à reconnaître des mots synthétisés et 
qu’ils ne le font pas en apprenant à utiliser le contexte mais en devenant plus 
efficaces dans leur analyse du signal émis. 

L’avantage majeur de la synthèse vocale reste sa souplesse 
d’utilisation : l’utilisateur d’un système de synthèse de textes n’a qu’à saisir, à 
l’aide d’un éditeur, la chaîne de caractères qu’il veut faire prononcer à l’ordi¬ 
nateur. Cependant, la voix restituée est artificielle. Comme le note Plaisant (in 
Cohen, 1992), cette imperfection de la voix a l’avantage de faire apparaître 
aux enfants qu’il ne s’agit que d’une machine; les interactions sont ainsi facili¬ 
tées car elles ne revêtent pas le caractère complexe des communications que 
l’enfant développe avec les adultes. 

3. PARADIGMES UTILISÉS DANS LES RECHERCHES 
SUR LA RÉTROACTION VERBALE 


Les recherches qui testent l’efficacité des systèmes de rétroaction 
verbale sur l’amélioration de certaines habiletés en lecture sont apparues re¬ 
lativement récemment dans la littérature scientifique de psychologie cogniti¬ 
ve (fin des années 1980). En conséquence, peu d’entre elles abordent la 
problématique de façon précise et certaines méthodologies utilisées laissent 
encore à désirer. Il a donc fallu faire un choix parmi elles, choix d’autant plus 
difficile à effectuer que le nombre de travaux est limité. 

La plupart tentent de répondre à trois questions. 

La première concerne l’étude du comportement des utilisateurs de¬ 
vant un dispositif de rétroaction verbale. Le comportement de demande d’aide 
est alors étudié en liaison avec certaines capacités métacognitives. 

La seconde pose le problème de l’amélioration des habiletés testées. 
Pour étudier cette question, les expérimentateurs recherchent des effets 
d’apprentissage 12 . Pour cela, ils soumettent d’abord les utilisateurs à un pré¬ 
test dans lequel sont administrés des tests standardisés ou des épreuves cons¬ 
truites par les expérimentateurs. Puis le sujet est soumis à un e phase d’utili¬ 
sation du système (la période étant très variable selon les recherches). En 
pratique, le sujet utilise un dispositif de pointage (souris le plus souvent mais 
également crayon optique ou contact avec l’écran) pour désigner ce qu’il veut 
faire prononcer par l’ordinateur. Celui-ci fournit alors le signal selon plusieurs 
formats (phonèmes, syllabes, mots, phrases). Dans certains cas, le sujet choi¬ 
sit lui-même le format qu’il désire entendre. Au fur et à mesure de l’émission 
du signal, les unités prononcées sont mises en surbrillance de façon à associer 
le traitement orthographique au traitement phonologique. Durant cette phase 
d’utilisation, plusieurs mesures comportementales sont recueillies : nombre 


12 Les mots en italiques seront utilisés, sans explications, dans les descriptions des expérien¬ 


ces. 
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de demandes d’aide, type de demande (quand le sujet a la possibilité de choi¬ 
sir la rétroaction verbale), latence des demandes, type de mots ou de seg¬ 
ments de textes demandés. Enfin, la dernière phase est un post-test qui est 
destiné à évaluer les progrès accomplis depuis le pré-test. Les résultats sont 
également analysés en rapport avec les performances d’un groupe contrôle 
(ayant les mêmes caractéristiques que les sujets dits expérimentaux soumis à 
la rétroaction verbale) pour lequel aucune rétroaction verbale est donnée. Les 
effets d’apprentissage sont évalués en comparant les performances du pré¬ 
test et du post-test. Par exemple, les sujets peuvent être soumis durant le pré¬ 
test à une épreuve de décodage : ils lisent des mots à voix haute et l’expéri¬ 
mentateur note l’exactitude des prononciations et, dans certains cas, leur la¬ 
tence. Au post-test, les enfants sont confrontés aux mêmes mots ou à des 
mots aux caractéristiques similaires; les mesures comportementales sont 
alors comparées. Pour avoir une indication sur le transfert d’apprentissage , 
d’autres mots peuvent être présentés, généralement plus difficiles à décoder. 

La dernière question concerne le type de segmentation à utiliser pour 
améliorer de façon optimale les habiletés considérées. Faut-il présenter le mot 
en entier ou le segmenter en syllabes ? Le type de segmentation optimal est- 
il fonction de la nature des déficiences en lecture des sujets ? La très impor¬ 
tante recherche d’Olson et Wise (1992) aborde ce problème (cf. 4.1) : elle il¬ 
lustre le fait que la recherche dans ce domaine arrive enfin à maturité et 
qu’elle aborde, avec une méthodologie expérimentale sérieuse, des probléma¬ 
tiques importantes qui ont des incidences sur la compréhension des mécanis¬ 
mes impliqués dans l’apprentissage de la lecture. 

A ces trois questions, il convient d’ajouter celle qui concerne l’étude 
différentielle des populations testées : généralement, un groupe de sujets 
bons lecteurs est comparé à un ou plusieurs groupes de sujets mauvais lec¬ 
teurs; des groupes de sujets avec des déficits sévères en lecture peuvent être 
également contrastés. En croisant diverses conditions expérimentales -possi¬ 
bilité ou non de rétroaction verbale, format de rétroaction proposé, population 
testée- les auteurs tentent de savoir s’il existe un type de segmentation opti¬ 
mal à proposer selon que l’utilisateur a ou non un déficit en lecture et selon la 
nature de ce déficit. 

Certaines questions annexes ont déjà été abordées précédemment et 
nous n’y reviendrons pas (la compréhension de la parole de synthèse par 
exemple). D’autres, le comportement de demande d’aide et l’étude des capa¬ 
cités métacognitives requises à l’utilisation de systèmes de rétroaction verba¬ 
le, seront encore développées ci-après. 

La cohérence des recherches peut être appréhendée uniquement en 
fonction de la nature des habiletés cognitives en lecture que les auteurs cher¬ 
chent à améliorer. C’est pourquoi nous avons choisi ce découpage -améliora¬ 
tion des capacités de décodage et de reconnaissance des mots; amélioration 
des capacités de compréhension- pour présenter les résultats de ces travaux. 
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4. AMÉLIORER LE DÉCODAGE 

ET LA RECONNAISSANCE DES MOTS 

4.1 Le choix du format de la rétroaction verbale 

L’amélioration du décodage et de la reconnaissance des mots pose le 
problème du format de la ségmentation à utiliser pour donner une rétroaction 
verbale. 

Pour van Daal et Reitsma (1990), le format de la rétroaction doit être 
en liaison avec les unités linguistiques utilisées lors de la lecture. Pour les mots 
plurisyllabiques, les auteurs suggèrent d’utiliser la syllabe, celle-ci étant l’uni¬ 
té de traitement la plus efficace en mémoire de travail et une unité compré¬ 
hensible même pour des enfants dont les capacités métaphonologiques sont 
pauvres 13 (Baddeley, 1978; Fox & Routh, 1980; Rozin & Gleitman, 1977). 

D’autres segmentations du mot sont possibles en particulier en grou¬ 
pes à centre vocalique (GCV, Spoehr & Smith, 1973; par exemple (mai/son; 
jar/din) et en fonction de la BOSS 14 (Taft, 1979), c’est à dire la structure syl¬ 
labique orthographique de base qui préserve les unités morphémiques dans 
des mots plurimorphémiques (par exemple chant/er; coton/neux). 

La syllabe peut être elle-même segmentée en attaque-rime dans le cas 
de mots monosyllabiques. La segmentation peut être également effectuée 
après la voyelle (par exemple pour note : /no/ + /te/). Cette dernière segmen¬ 
tation (ici appelée segmentation post-voyelle ) semble produire de meilleurs 
apprentissages que celle en attaque-rime (Fayne & Bryant, 1981). 

Quatre formats de rétroaction verbale sont généralement manipulés 
pour étudier leur efficacité sur le décodage et la reconnaissance des mots : la 
rétroaction peut concerner soit le mot entier, soit les syllabes du mot avec une 
segmentation généralement en BOSS, soit les unités subsyllabiques avec une 
segmentation en attaque-rime ou en post-voyelle, soit les phonèmes du mot. 

Van Daal et Reitsma (1990) font l’hypothèse que, comparativement à 
une condition mot en entier, la segmentation en syllabes doit être préférée 
quand les problèmes de lecture se situent essentiellement dans le traitement 
grapho-phonologique. Ce type de segmentation peut stimuler le lecteur car il 
doit lui-même assembler les sons émis pour se représenter le patron sonore 
du mot entier. La condition mot entier peut, quant à elle, faciliter l’accès au 
lexique car le sens du mot est récupéré directement, améliorant en cela l’éta¬ 
blissement des relations grapho-sémantiques. Dans leur étude, les sujets peu¬ 
vent choisir entre deux types de rétroaction durant la phase d’utilisation 15 : 
soit le mot entier, soit des unités subsyllabiques (selon les mots, attaque-rime 


13 Voir Gombert (1990), chapitre II, pour une revue de travaux portant sur le développement 
de la compétence à discriminer les sons langagiers. 

14 En anglais pour Basic Orthographie Syllabic structure. 

15 Les auteurs utilisent de la parole enregistrée. 
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ou post-voyelle). Les sujets sont des enfants de 10 ans ayant un retard en lec¬ 
ture de deux niveaux au moins. Les résultats montrent que, quel que soit le 
format choisi, les sujets demandent volontairement une rétroaction pour 46% 
des mots présentés. Cependant, le nombre de demandes dépend fortement du 
type de format : les demandes sont très élevées pour le mot entier (75%). En 
fait, ce comportement semble refléter une certaine paresse de la part des su¬ 
jets qui leur est cependant très profitable. En effet, les latences des demandes 
sont plus élevées quand le choix porte sur la segmentation subsyllabique : tout 
se passe comme si l’enfant cherchait d’abord à décoder le mot puis, devant ses 
essais infructueux, demandait de l’aide. Cette hypothèse est vérifiée par l’étu¬ 
de des effets d’apprentissage. Un effet d’apprentissage est trouvé en ce qui 
concerne le décodage des mots, cet effet étant de même ampleur quel que soit 
le type de demande. Autrement dit, bien que la demande en subsyllabes soit 
beaucoup moins élevée que celle en mot entier, elle produit le même effet 
d’apprentissage indiquant en cela l’efficacité de ce type de rétroaction. De 
plus, il existe un transfert d’apprentissage plus important dans cette condition 
que dans la condition mot en entier. Cependant, les enfants ne sont pas très 
sélectifs dans leur demande : les mots qu’ils ont décodés sans erreurs durant 
le pré-test sont autant demandés que les mots pour lesquels ils ont échoué. Ce 
résultat pose le problème du comportement de demande d’aide, problème 
fondamental dans l’utilisation d’un système de rétroaction sur lequel nous re¬ 
viendrons. 

A notre connaissance, une seule recherche (Wise 16 , 1988 citée in Oi¬ 
son, Wise & Rack, 1989) compare un format de rétroaction en GCV contre un 
format en BOSS. Le matériel est composé de mots plurisyllabiques et il est 
présenté à des enfants de niveau 2 en lecture. Ceux-ci, durant les trois phases 
de l’expérience, doivent prononcer à voix haute les mots; leur pourcentage de 
réponses correctes est ensuite analysé. Les résultats montrent un effet d’ap¬ 
prentissage plus important pour le format BOSS. 

Dans une recherche très bien contrôlée au niveau méthodologique, 
Wise (1992) compare 4 formats de rétroaction : 1) le mot entier, 2) la syllabe 
( BOSS ), 3) l’attaque-rime, 4) le phonème. Des sujets de 7 ans et de 8 ans sont 
divisés en trois groupes : niveau 1 d’apprentissage de la lecture avec perfor¬ 
mances normales à un test standardisé (1A - Normal), et niveau 1 et 2 avec de 
faibles performances (respectivement IA - Bas et 2A - Bas). Le pré-test et le 
post-test sont constitués d’une épreuve de lecture à voix haute de 36 mots. 
Pendant la phase d’utilisation, l’enfant lit également le mot à voix haute après 
avoir demandé une rétroaction. Le pourcentage de réussite est analysé pour 
les trois phases. 


16 C’est l’équipe de Wise et Oison, aux USA, qui a exploré en détail le problème de l’efficacité 
du type de segmentation. Sur la base des résultats d’un programme d’étude sur les dyslexies 
(«Colorado remediation project», DeFries et al., 1991), ces auteurs ont été chargés de cons¬ 
truire un outil susceptible de développer les habilités de reconnaissance des mots et de déco¬ 
dage phonologique chez des enfants dyslexiques. 
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La figure 1 montre l’effet d’apprentissage obtenu pour les trois grou¬ 
pes en fonction du format de rétroaction. 


60 



Moyenne IA-Bas IA-Normal 2A - Bas 

Groupes 

□ Mot entier □ Syllabe ■ Attaque-Rime ■ Phonème 


Figure 1 

Différences post-test moins pré-test dans le pourcentage des mots correctement 
prononcés en fonction du type de rétroaction et du groupe 17 


On observe que l’effet d’apprentissage est faible lorsque le format con¬ 
cerne le phonème. Les sujets les plus jeunes ayant des difficultés de lecture 
(IA - Bas) ont plus de difficulté lorsque le format est segmenté en attaque- 
rime que lorsque le format concerne la syllabe ou le mot entier. Les autres su¬ 
jets réussissent aussi facilement pour les formats segmentés (syllabe ou atta¬ 
que-rime) que pour le format mot entier. 

La charge en mémoire de travail explique la difficulté des enfants à as¬ 
socier plusieurs phonèmes pour former un mot et ceci d’autant plus que les 
mots sont longs. La figure 2 montre les résultats obtenus pour le groupe des 
enfants du groupe IA - Bas en fonction de la longueur des mots. 

Pour les mots monosyllabiques, le format attaque-rime n’est pas plus 
difficile que le format mot entier. Par contre, les enfants ont plus de difficulté 
avec ce format quand les mots sont plurisyllabiques, les effets d’apprentissage 
étant aussi faibles que ceux obtenus pour le format phonème. Quant au format 
syllabe, il produit des effets d’apprentissage sensiblement équivalents à ceux 
du format mot entier. 


17 D’après Wise 1992, Fig.4 p.160 
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Nombre de syllabes 


□ Mot entier H Syllabe ■ Attaque-Rime ■ Phonème 


Figure 2 

Groupe IA - Bas : différences post-test moins pré-test dans le pourcentage des mots 
correctement prononcés en fonction du type de rétroaction et du nombre de 
syllabes ia . 

Il ressort de ces résultats que 1) le format phonème est à proscrire 19 ; 
2) les formats en syllabe et en attaque-rime produisent des effets d’apprentis¬ 
sage semblables à ceux obtenu pour le format mot entier; 3) le format attaque- 
rime apparaît aussi difficile que le format phonème chez des lecteurs débu¬ 
tants ayant un faible niveau en lecture quand les mots sont longs. 

Les recherches rapportées précédemment ont essentiellement contri¬ 
bué à sélectionner le format de rétroaction verbale à utiliser. Dans celles-ci, 
les sujets sont soumis à la rétroaction verbale durant une brève période de 
temps (une semaine au plus). Les effets à court terme obtenus permettent 
donc de déterminer quel est le format de rétroaction qui donne un apprentis¬ 
sage rapide et relativement stable. Des études à long terme sont cependant 
nécessaires pour évaluer si la rétroaction permet des transferts d’apprentissa¬ 
ge. Dans ce type de recherches, les sujets sont soumis à la rétroaction pendant 
une période de plusieurs mois. 


18 D’après Wise 1992, Fig.5 p.160. 

19 L’expérience de Spaai, Reitsma et Ellermann (1991) conforte cette conclusion : ils observent 
chez des enfants allemands qui avaient 9 mois seulement d’apprentissage de la lecture que l’effet 
d’apprentissage pour le format phonème est significativement moins important que l’effet obtenu 
pour le format mot entier. De plus, cet effet ne diffère pas significativement de l’effet d’appren¬ 
tissage obtenu pour le groupe sans rétroaction. 
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4.2 Les effets à long terme de la rétroaction verbale 

Deux recherches, parmi les plus importantes, ont été menées par 
l’équipe de Wise et Oison pour étudier les effets à long terme de la rétroaction 
verbale sur le décodage et la reconnaissance des mots. Dans la première (Wise 
& al., 1989), un monitorat et des encouragements importants sont fournis par 
l’expérimentateur pour que l’enfant utilise la rétroaction. Dans la seconde (Oi¬ 
son & Wise, 1992), un plus grand éventail de sujets est utilisé et ceux-ci reçoi¬ 
vent un monitorat moins important. Les résultats des deux recherches sont 
comparés dans l’article de 1992 20 . 

Des sujets de 10 ans en moyenne sont soumis à la rétroaction verbale. 
Ils lisent des textes pendant une demi-heure par jour pendant 6 mois. Les su¬ 
jets sont sélectionnés à partir de tests standardisés évaluant leur niveau en 
lecture. Sur la base de ces résultats, les auteurs retiennent les sujets qui ont 
des déficits en lecture et les classent en deux groupes : un groupe de sujets 
avec un déficit léger en lecture et un groupe avec un déficit sévère. 

En plus de ces tests, d’autres épreuves sont soumises aux sujets du¬ 
rant le pré-test et le post-test : une épreuve de reconnaissance de mots à 
temps limité (les mots apparaissent pendant 2 secondes à l’écran et l’enfant 
doit les prononcer correctement), une épreuve de décodage de non-mots; 
deux épreuves métaphonologiques (les sujets doivent composer des non-mots 
à partir de la première et dernière syllabe de deux mots et ôter un phonème 
dans un non-mot); et enfin un test d’intelligence. 

Pendant la phase d’utilisation, les enfants choisissent eux-mêmes les 
textes qu’ils veulent lire (ceux-ci correspondent à leur niveau en lecture tel 
qu’il est évalué durant le pré-test). Après chaque texte, la compréhension est 
testée par des questions à choix multiples. Quatre conditions sont mani¬ 
pulées : les sujets reçoivent un format de rétroaction qui concerne soit 1) le 
mot entier; 2) la syllabe (BOS.S) ; 3) l’attaque-rime. La dernière condition est 
la condition contrôle : les sujets sont soumis aux mêmes pré- et post-tests 
mais reçoivent normalement leur enseignement en classe. 

En ce qui concerne le décodage de non-mots (cf. Figure 3), les résul¬ 
tats font apparaître que, relativement aux sujets du groupe contrôle, les sujets 
des groupes expérimentaux montrent un effet d’apprentissage 4 fois plus im¬ 
portant. Le monitorat (phase 1) est bénéfique aux sujets notamment quand le 
format concerne l’attaque-rime et la syllabe. Si le monitorat est moins impor¬ 
tant, les gains obtenus dans les 3 formats sont équivalents. En moyenne, les 
sujets qui obtiennent les effets d’apprentissage les plus importants sont ceux 
qui ont reçu le plus d’attention individuelle et qui ont débuté leur apprentis¬ 
sage avec des scores élevés aux épreuves métaphonologiques. 


20 On utilisera la notation d’Olson et Wise (1992) pour spécifier les recherches lors de la 
comparaison : la phase 1 concernera l’expérience de 1989 (monitorat important); la phase 2, 
celle de 1992 (monitorat moins important). 
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- Moyenne 


Figure 3 

Différences post-test moins pré-test dans le pourcentage de non-mots correctement 
décodés en fonction du type de rétroaction et de l'importance du monitorat 2 ’. 


En ce qui concerne l’épreuve de reconnaissance de mots (cf. figure 4), 
l’effet d’apprentissage des groupes expérimentaux est deux fois plus impor¬ 
tant que celui du groupe contrôle. L’effet du monitorat s’avère ici non signifi¬ 
catif et il n’existe pas d’interaction avec le format. Cependant, une différence 
significative est observée entre les 2 phases pour le format attaque-rime. 

Sur les deux phases, le niveau en lecture des sujets du groupe contrôle 
augmente de 0.33 niveau alors que le gain est de 0.66 niveau pour les sujets 
expérimentaux. L’ensemble de ces résultats doit néanmoins être analysé en 
fonction du degré de sévérité des déficits en lecture des sujets testés. 

Par exemple, en ce qui concerne le décodage de non-mots (cf. figure 
5), c’est le format attaque-rime qui produit les meilleurs effets d’apprentissage 
pour les sujets avec un déficit léger. Pour les sujets avec un déficit sévère, le 
format syllabe (BOSS) est le meilleur. Pour ces sujets, l’effet d’apprentissage 
obtenu pour le format syllabe est 140% supérieur à celui obtenu pour le format 
attaque-rime et 61% supérieur à celui obtenu pour le format mot entier. 


21 D’après Oison & Wîse 1992, Tab.3 p.123. 















Contrôle Mot entier Syllabe Attaque-rime 

Formats 



□ Déficit léger 


Déficit sévère 



Figure 5 


Différences post-test moins pré-test dans le pourcentage de non-mots correctement 
décodés en fonction du type de rétroaction et du degré de sévérité du déficit en 
lecture . 23 


22 D’après Oison & Wise 1992, Tab.4 p. 125. 

23 D’après Oison & Wise 1992, Tab.5 p.127. 
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En ce qui concerne les épreuves métaphonologiques, les résultats in¬ 
diquent qu’il existe une relation forte entre le score obtenu à celles-ci lors du 
pré-test et l’importance des effets d’apprentissage sur le décodage et la recon¬ 
naissance des mots. Les sujets qui sont au-dessus de la moyenne à l’épreuve 
de construction de non-mots ont des effets d’apprentissage sur le décodage 
deux fois plus importants que les sujets en dessous de la moyenne. De plus, 
on observe chez les sujets qui réussissent le mieux l’épreuve de délétion de 
phonèmes, des effets d’apprentissage plus importants sur la reconnaissance 
des mots. 

On observe donc des effets à long terme d’une rétroaction verbale sur 
le décodage et la reconnaissance de mots. De plus, les résultats de Wise et col¬ 
laborateurs montrent l’importance du monitorat et des encouragements don¬ 
nés par l’expérimentateur dans l’utilisation d’un tel outil de remédiation. 
L’effet du format de la rétroaction varie en fonction du déficit en lecture : le 
format attaque-rime est le plus avantageux pour des sujets avec un déficit lé¬ 
ger mais c’est le plus handicapant pour des sujets avec un déficit sévère. Le 
format syllabe est le plus avantageux pour des sujets avec un déficit sévère et 
il est équivalent au format mot entier pour des sujets avec un déficit léger. En¬ 
fin, les résultats sont liés aux capacités métaphonologiques des sujets : l’im¬ 
portance des effets d’apprentissage est prédite par la réussite aux épreuves 
métaphonologiques. 

4.3 Le comportement de demande d'aide 24 

On a vu que les résultats de Van Daal et Reitsma (1990) posaient le 
problème de la demande d’aide. Les auteurs suggèrent que les mauvais lec¬ 
teurs ne sont pas capables de déterminer quand ils ont réellement besoin 
d’aide. 


La recherche d’Olofsson (1992, exp.2) conforte ce propos. L’auteur 
étudie l’effet d’une rétroaction verbale en mot entier chez des enfants mauvais 
lecteurs de niveau 2 (8 ans) à 7 (13 ans). Les résultats indiquent des effets 
d’apprentissage plus importants pour le décodage de mots et de non-mots 
quand l’enfant se situe à un niveau de lecture élevé (niveaux 4 à 7). Une pé¬ 
riode plus longue d’apprentissage du système est nécessaire chez les jeunes 
enfants. Ceux-ci ont également besoin que l’expérimentateur (ici leur ensei¬ 
gnant) les guide dans l’utilisation du système et dans leur demande d’aide. 

Il apparaît ainsi que l’utilisation d’un système de rétroaction verbale 
s’avère limité chez des sujets jeunes qui n’ont pas encore de réelles capacités 
métacognitives pour gérer correctement leur demande d’aide et pour auto- 
évaluer leurs connaissances. Farmer et al. (1992) observent le même résultat 


24 Voir van Daal et van der Leij (1992) et Wise et Oison (1992) qui analysent les comportement 
de demande d’aide dans des expérimentations avec des enfants ayant des difficultés d’écriture. 
Dans ces recherches, le système de rétroaction, après avoir donné une rétroaction verbale, 
donne une rétroaction de ce que l’enfant écrit à l’aide du clavier de l’ordinateur. 
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pour des sujets ayant des déficits sévères en lecture. Leurs sujets sont âgés de 
16 ans en moyenne et ont un niveau en lecture de 11 ans avec un QI cependant 
normal. Ils lisent des textes de 140 mots avec un format de rétroaction portant 
sur le mot entier. Aucun effet d’apprentissage est observé : les demandes sont 
en effet très peu nombreuses (4 mots en moyenne par texte), les sujets devant 
être constamment sollicités durant la phase d’utilisation pour exploiter effica¬ 
cement le système. 

Van Daal et Reitsma (1993) montrent des résultats sensiblement dif¬ 
férents de ceux de 1992. Les auteurs font l’hypothèse que leurs résultats pour¬ 
raient être biaisés du fait du faible pourcentage de mots faciles à décoder dans 
les textes : le rapport (de 1 mot facile pour 4 mots difficiles) aurait produit 
l’impression que tous les mots étaient difficiles à décoder. Ils égalisent donc le 
nombre de mots faciles et difficiles à décoder dans leur matériel. Trois grou¬ 
pes de sujets sont utilisés. Un groupe de lecteurs avec un niveau normal en 
lecture et un groupe de lecteurs ayant un retard de 1.5 niveau par rapport au 
premier groupe lisent des listes de mots (450 au total sur 8 sessions) avec une 
rétroaction verbale à la demande dans le format mot entier. Un autre groupe 
de sujets, ayant un retard en lecture, lisent en condition rétroaction verbale 
obligatoire. Les résultats montrent que les mauvais lecteurs sont ici plus 
prompts à demander de l’aide pour les mots difficiles; il n’existe pas, à ce ni¬ 
veau, de différence significative avec les bons lecteurs. Ces derniers deman¬ 
dent de l’aide essentiellement au début des premières sessions de la phase 
d’utilisation alors que l’autre groupe reste dépendant de la rétroaction verbale 
jusqu’à la fin des sessions. Un effet d’apprentissage est observé au niveau de 
l’exactitude du décodage quel que soit le groupe. Au niveau de la vitesse de 
décodage, un effet d’apprentissage est également obtenu mais il diffère selon 
le type de rétroaction : les bons lecteurs bénéficient plus de la rétroaction 
lorsque celle-ci est à la demande alors qu’une rétroaction obligatoire est plus 
profitable aux mauvais lecteurs. 

Il semble donc que la rétroaction verbale doit être manipulée en fonc¬ 
tion du degré de sévérité des déficits en lecture des utilisateurs. Manifeste¬ 
ment, les bons lecteurs utilisent celle-ci, volontairement, pour évaluer 
l’exactitude de leur décodage. Par contre, l’inefficacité du décodage des mau¬ 
vais lecteurs les empêche de détecter leurs erreurs : dans ce cas, une rétroac¬ 
tion verbale obligatoire leur est plus profitable. 

5. AMÉLIORER LA COMPRÉHENSION 


La rétroaction verbale peut faciliter la compréhension d’un texte en 
permettant au lecteur de mieux mémoriser les unités de traitement linguisti¬ 
que (mots, syntagmes, propositions et phrases), de mieux intégrer l’informa¬ 
tion nouvelle à l’information ancienne et de mieux «purger» l’information 
ancienne de la mémoire de travail pour l’encodage propositionnel (Leong, 
1992a). Les résultats obtenus ne sont pas homogènes et il convient de les dis¬ 
cuter en fonction de la population testée et du format de la rétroaction. 
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Leong (1992a) cherche à améliorer la compréhension de textes 
auprès d’enfants de niveaux 6, 7 et 8 à l’aide d’un système d’aide interfacé avec 
DECtalk. A chaque niveau de lecture, les enfants sont divisés en deux groupes 
après la passation de tests de compréhension standardisés : ceux qui sont au- 
dessus de leur niveau et ceux se situant en dessous de leur niveau d’appren¬ 
tissage de la lecture. L’étude (d’une durée de 18 semaines) comprend un pré¬ 
test de lecture de 12 textes de 200 mots sur ordinateur, une phase d’utilisation 
du système avec la lecture des mêmes textes en auto-présentation 25 avec ou 
sans rétroaction verbale et un post-test. Le pré-test comprend également une 
familiarisation à l’utilisation du système et une évaluation de la compréhen¬ 
sion des textes par des questions ouvertes inférentielles. Chaque texte est 
segmenté en propositions et présenté sous cette forme en auto-présentation. 
Dans la condition rétroaction verbale, DECtalk prononce les propositions au 
rythme de 200 mots par minute. Le sens de certains mots présélectionnés 
(mis en surbrillance) peut être demandé par les sujets dans les deux condi¬ 
tions expérimentales. Les scores obtenus aux questions de compréhension 
sont analysés. Les résultats font apparaître qu’il existe une amélioration de la 
compréhension pour les deux conditions de présentation mais l’efficacité du 
système est observée pour seulement deux textes chez des sujets se situant 
au-dessus de leur niveau attendu de compréhension. 

Selon Leong, plusieurs paramètres sont à considérer pour améliorer 
l’efficacité du système dans la compréhension de textes. D’abord l’organisa¬ 
tion textuelle, tant au niveau de la surface (longueur des mots, fréquence lexi¬ 
cale, familiarité) qu’à un niveau plus profond (complexité inférentielle), doit 
être travaillée pour rendre le matériel compréhensible. Ensuite, la présenta¬ 
tion des textes sur ordinateur doit être faite sous un format qui facilite la prise 
d’information. Enfin, le niveau d’expertise des lecteurs doit être spécifié au ni¬ 
veau de leur savoir général, de leur savoir textuel et de leurs stratégies d’ap¬ 
prentissage. 

Ellrind, Cohen et Murray (1993) montrent des résultats plus tangibles 
que ceux de l’expérience précédente. Les auteurs étudient, auprès d’une po¬ 
pulation de 28 enfants dyslexiques, si un système de rétroaction verbale amé¬ 
liore leur habileté à comprendre des textes. Les sujets sont issus d’une école 
privée où ils sont soumis à un programme de remédiation. Pour 70% d’entre 
eux, leur niveau en lecture est inférieur d’au moins un niveau à celui attendu. 
Le système utilisé est un véritable système d’aide à la lecture : un mot préala¬ 
blement sélectionné peut être prononcé en entier, syllabe par syllabe ou lettre 
par lettre; le sujet peut également faire prononcer une phrase entière, deman¬ 
der le sens d’un mot et augmenter ou diminuer la vitesse de prononciation. Les 
sujets sont divisés en deux groupes : l’un bénéficie du système pour lire, 
l’autre non. Les sujets subissent un pré-test en début d’année scolaire et un 
post-test un semestre plus tard (les tests sont des tests standardisés de com- 


25 Le sujet appuie sur la barre espace de l’ordinateur pour faire apparaître les segments qui 
s’affichent au fur et à mesure sur l’écran. 
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préhension). Les résultats font apparaître que les sujets qui ont bénéficié du 
système d’aide (20 à 25 heures d’utilisation) augmentent leur niveau de com¬ 
préhension en lecture de 1.2 niveau en moyenne. 70% d’entre eux montrent 
un gain d’au moins un niveau, 51% de ceux-ci gagnant de 2 à 5 niveaux. Tous 
les sujets ne bénéficient pas de l’utilisation du système : 14% ne montrent pas 
d’évolution et 14% réussissent moins bien après l’utilisation. Relativement à 
ce dernier résultat, les auteurs font observer qu’il convient d’être sélectif dans 
l’utilisation d’un tel système et qu’il est souhaitable de déterminer, par un dia¬ 
gnostic préalable des difficultés, les individus qui pourront bénéficier d’un sys¬ 
tème d’aide. 


Conclusion 

Bien que le nombre de recherches dans le domaine de la rétroaction 
verbale soit encore relativement restreint, il est certain que des résultats en¬ 
courageants émergent de celles-ci. D’après ce que rapportent les auteurs des 
travaux, les enfants se réjouissent d’utiliser un tel système; de même, les en¬ 
seignants et les parents reconnaissent que les enfants progressent et qu’ils 
s’intéressent plus à la lecture (Oison & Wise, 1992). 

La rétroaction verbale a des effets à long terme sur l’efficacité du dé¬ 
codage, de la reconnaissance des mots et de la compréhension. Les résultats 
les plus intéressants concernent le format de la rétroaction à utiliser. D’une fa¬ 
çon générale, une segmentation en unités subsyllabiques (en attaque-rime no¬ 
tamment) apparaît très profitable pour améliorer le décodage et la 
reconnaissance des mots. Ce type de format est particulièrement adapté à des 
enfants qui débutent l’apprentissage de la lecture et qui n’ont pas de déficits 
notamment au niveau des capacités métaphonologiques. Il permet lui-même 
que ces capacités métaphonologiques se développent facilitant en cela l’ap¬ 
prentissage de la lecture. La rétroaction verbale agit manifestement en allé¬ 
geant la charge cognitive et, en conséquence, permet la constitution de 
relations fortes entre les représentations mentales des codes phonologiques 
et orthographiques. Il apparaît en effet que, lorsque la surcharge cognitive est 
trop importante dans une rétroaction, comme ceci est le cas pour une segmen¬ 
tation en unités phonémiques, le bénéfice apporté par celle-ci est nul. Pour les 
enfants plus âgés, un format mot entier est également profitable. Manifeste¬ 
ment ce type de format est adapté à une période d’apprentissage pour laquelle 
les enfants reconnaissent de nouveaux mots par analogie avec des mots an¬ 
ciens. 


Les résultats obtenus avec des enfants présentant des déficits en lec¬ 
ture sont également intéressants; le format de la rétroaction interagissant 
avec le degré de sévérité des déficits. Pour ce type de lecteurs, une segmen¬ 
tation en syllabes (B OS S) ou une présentation du mot entier apparaît profita¬ 
ble. Cependant, l’utilisation efficace du système pose problème. Une 
rétroaction obligatoire s’avère plus efficace pour eux. De plus, ces lecteurs 
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présentant des déficits au niveau des capacités métaphonologiques, il apparaît 
nécessaire de mettre en place des phases intensives de monitorat. 

Plusieurs recherches ont en effet montré la nécessité d’incorporer, 
dans les phases initiales d’utilisation de systèmes à rétroaction verbale, des 
guidances métacognitives qui aident le lecteur à internaliser son savoir. Dans 
des systèmes d’aide à la lecture plus sophistiqués, des exercices aident le lec¬ 
teur à être plus conscient de sa lecture et à produire plus d’efforts dans ses 
apprentissages. L’équipe de Scardamalia et Bereiter ont par exemple mis au 
point un système (CSILE pour Computer-Suported Intentional Leaming 
Environments; cf. Scardamalia & al., 1989) qui peut être utilisé quel que soit 
le niveau de lecture. CSILE est un tuteur intelligent qui fonctionne à partir 
d’une base de données construite, en temps réel, à partir des actions émises 
par les utilisateurs. Ceux-ci participent donc activement à la construction du 
savoir implémenté en interagissant entre eux. Le système peut être utilisé in¬ 
différemment par des élèves, des enseignants ou des experts du domaine. 

Il demeure que les recherches futures devront, d’une part, répliquer 
les résultats obtenus et, d’autre part, déterminer très exactement le type de 
système (rétroaction à la demande versus obligatoire) et le format de la ré¬ 
troaction à utiliser selon le niveau en lecture des utilisateurs et la nature de 
leurs déficits. 

L’ensemble de ces résultats est par ailleurs parfaitement en accord 
avec ce que l’on sait déjà de l’acquisition de la lecture : les capacités métapho¬ 
nologiques et la maîtrise du décodage sont des aspects critiques dans l’acqui¬ 
sition du code alphabétique. On a vu que leurs pratiques étaient largement 
développées dans les systèmes de rétroaction présentés et qu’elles pouvaient 
être améliorées. En cela, ce courant de recherches apporte des évidences sup¬ 
plémentaires sur l’importance de l’apprentissage systématique du code alpha¬ 
bétique dans l’enseignement de la lecture. 

La synthèse vocale, comme nouveau moyen d’appropriation de l’écrit, 
ouvre donc des perspectives nouvelles dans l’enseignement de la lecture car 
elle permet à l’enfant de prendre en charge l’acquisition de ses connaissances. 
Il ne fait aucun doute que ces technologies nouvelles sont en passe de modifier 
profondément l’organisation du système scolaire. Il reste cependant aux légis¬ 
lateurs de préparer cette mutation en fournissant à celui-ci les moyens appro¬ 
priés et en agissant au niveau de la formation des maîtres. 
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Introduction 

Il y a de ces disciplines, de ces sujets d’étude, qui présentent toutes 
les apparences d’un corpus de connaissances relativement stables. Par exem¬ 
ple, et sans vouloir offusquer personne ni diminuer l’effort de certains collè¬ 
gues, les enseignements relatifs aux caractéristiques et aux applications de la 
courbe normale des probabilités n’ont pas beaucoup changé depuis ces der¬ 
nières années; ni d’ailleurs l’enseignement des algorithmes de résolution 
d’équations du premier degré à deux inconnues ! On ne peut en dire autant de 
la génétique, de la technologie informatique et de l’évaluation formative des 
apprentissages ! 

Au cours des deux dernières décennies, l’évaluation formative a fait 
l’objet de plusieurs écrits et, malgré tout, elle s’inscrit encore aujourd’hui dans 
le sillon d’une réflexion intense qui n’a jamais cessé de dominer la théorie et 
la pratique. Après les clarifications qui s’imposaient quant à sa nature et aux 
aspects multiples de sa fonction de régulation, on a peut-être eu l’impression 
de pouvoir se reposer un peu en laissant la poussière retomber. Mais «pierre 
qui roule n’amasse pas mousse» et la pratique de l’évaluation formative, là où 
on a réussi à l’implanter avec de nombreux procédés de séduction, est tou¬ 
jours une entreprise en chantier. 

L’avènement des sciences dites cognitives et des pédagogies qui s’en 
inspirent vient raviver un domaine encore en ébullition. L’auteur de ce texte 
s’intéresse à la méthodologie de l’évaluation formative depuis plusieurs an¬ 
nées et, au moment d’entrevoir les perspectives qui s’offrent à ce type d’éva¬ 
luation, il a cru bon de prendre un certain recul afin de mieux entrevoir 
l’horizon. Les mouvances et tendances qui s’annoncent indiquent qu’il faudra 
bien tôt ou tard se mettre à pied d’œuvre car les impératifs de certaines péda¬ 
gogies sont déjà en avance sur les pratiques d’évaluation qui ont été mises en 
œuvre. 


1. L'HÉRITAGE DES PIONNIERS 

Les premiers exemples qui nous ont été donnés comme source d’ins¬ 
piration pour la méthodologie de l’évaluation formative s’inscrivent dans une 
pédagogie par objectifs teintée d’une conception de l’éducation que l’on a ap¬ 
pelée «pédagogie du succès» (ou la pédagogie de la maîtrise qui est une tra¬ 
duction littérale du «mastery learning» des écrits anglo-saxons). Bloom, 
Hastings et Madaus (1971 et 1981) ont sans doute donné le coup d’envoi en 
proposant un exemple de questionnaire écrit suivi d’un corrigé constitué de 
renvois divers aux notes de cours ou au manuel de base. L’utilisation de ce cor¬ 
rigé par les élèves devait tenir lieu de correctif pédagogique ce qui confère un 
caractère formatif à l’instrument utilisé (Bloom et coll., 1971, p. 129 et suiv.). 

Il serait difficile de rendre compte des approches méthodologiques 
qui se sont succédées par la suite. Les dispositifs d’enseignement qui ont servi 
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à rendre opérationnelle la pédagogie du succès, que ce soit pour accommoder 
l’enseignement collectif (p. ex. Block et Anderson, 1975) ou l’enseignement 
individualisé (p. ex., Keller, 1968), se sont prêtés à une méthodologie de l’éva¬ 
luation formative qui présente des caractères constants : un contenu découpé 
en modules, une progression balisée en objectifs intermédiaires et en objectifs 
terminaux et des tests dits formatifs (de type papier crayon, pour la plupart). 
La mesure à interprétation critérielle, vouée plus ou moins explicitement à la 
certification des compétences en évaluation sommative (ce qui n’est pas tou¬ 
jours évident dans les écrits d’origine), a vite été récupérée par les praticiens 
de la pédagogie du succès pour devenir l’élément clé de la méthodologie de 
l’évaluation formative. La séquence «apprentissage, évaluation formative, 
enseignement correctif» est devenue le cadre conceptuel le plus répandu 
pour alimenter le discours sur l’évaluation formative que ce soit pour rédiger 
des guides docimologiques ou pour énoncer des politiques d’évaluation. Selon 
ce modèle de démarche, les trois éléments se présentent comme des étapes 
distinctes et, du point de vue de la formation des personnels de l’éducation, 
l’évaluation formative est en soi un objet d’étude qui se distingue de la didac¬ 
tique et de la pédagogie, ce qui n’est certes pas forcément la seule façon de 
voir comme en témoignent des écrits récents (p. ex., Bain, 1988; Allai, 1979 et 
1988; Scallon, 1992). La notion de «remédiation» n’est cependant pas une no¬ 
tion abusée et peut se présenter comme un moyen de régulation approprié se¬ 
lon certaines théories d’apprentissage comme en témoigne un ouvrage récent 
de Fisher (1993, pp. 22 et suivantes). Dans la suite de ce texte, la remédiation 
comme telle n’est pas remise en cause. Il sera plutôt question de réexaminer 
le caractère disjoint des trois phases de la séquence «apprentissage, évalua¬ 
tion formative, enseignement correctif» tel que suggéré dans les écrits tradi¬ 
tionnels sur l’évaluation. 

2. LORSQUE LA NÉCESSITÉ 
EST MÈRE DE L'INVENTION 


Qu’arrive-t-il si la situation pédagogique n’offre pas aux élèves un iti¬ 
néraire balisé en objectifs ou en tranches de contenu ? Ou encore, qu’arrive- 
t-il lorsque le parcours ne s’échelonne plus depuis les objectifs les moins éle¬ 
vés d’une hiérarchie jusqu’aux objectifs terminaux ? Et c’est pourtant le genre 
d’interrogation qu’il faut soulever au regard des pédagogies dites de situation 
ou de projets ou encore dans des contextes d’apprentissage par problèmes. 
Les programmes révisés de français langue maternelle pour les écoles primai¬ 
res du Québec (Ministère de l’Éducation du Québec, 1979), des approches 
nouvelles de la didactique de la lecture au primaire (Tremblay et Demers, 
1990) et enfin l’apprentissage par problèmes que plusieurs facultés de méde¬ 
cine, dont celles du Québec, ont adopté et sont en voie de mettre en place 
(voir Berkson, 1990) en sont des exemples bien concrets. On comprendra 
que, dans ces divers cas, le point d’entrée de toute démarche d’apprentissage 
est une tâche complexe à réaliser ou un problème à résoudre, c’est-à-dire une 
tâche correspondant à un élément beaucoup plus près de l’objectif terminal 



162 La métacognition 


que d’un objectif de départ dans une longue séquence d’apprentissages inter¬ 
médiaires. La séquence «apprentissage / évaluation formative / enseignement 
correctif» n’est plus appropriée pour répondre aux interrogations soulevées 
dans le cadre de pédagogies dites de situation. 

D’abord, l’apprentissage n’est pas soumis aux règles de la pédagogie 
de maîtrise qui indiquent que tout élément doit être maîtrisé avant d’en abor¬ 
der un autre. Dans cet ordre d’idées il est difficile de concevoir un enseigne¬ 
ment correctif qui a pour visée principale le contrôle rigoureux d’une 
progression. Que dire alors de l’évaluation formative proprement dite ? L’in¬ 
certitude n’est pas aussi évidente qu’on l’aurait cru car il est toujours possible 
d’observer, de mesurer ou encore d’apprécier une performance. L’imbroglio se 
présente avec netteté lorsqu’il s’agit de concevoir ou de visualiser la mise en 
scène. Qui évalue en pédagogie de situation ? La réponse est toute trouvée en 
imaginant un épisode d’objectivation de sa pratique de communication par 
l’élève dans le cadre des programmes renouvelés de français au Québec. La ré¬ 
ponse vient naturellement aussi lorsque, dans une situation d’apprentissage 
par problèmes comme en médecine, les étudiants doivent se saisir d’un cas cli¬ 
nique et établir leurs besoins d’information et leurs objectifs d’apprentissage 
avant d’aller plus loin. La participation, voire l’engagement personnel des élè¬ 
ves prend de l’ampleur et vient agrandir l’écart qui s’est creusé entre un mo¬ 
dèle d’évaluation formative de départ et une pratique d’évaluation qui doit 
répondre à des impératifs d’un tout autre ordre que ceux de la pédagogie de 
maîtrise. Il est important de constater que la participation des élèves à leur 
propre évaluation formative ne tient pas à des exigences d’ordre purement 
pratique telles l’allégement du fardeau que présente souvent l’évaluation dans 
un groupe d’élèves au regard de performances complexes, par exemple. Cette 
particularité tient beaucoup plus à un changement majeur au niveau de l’objet 
même de l’évaluation formative, un matériau nouveau que l’on trouve dans le 
champ des sciences cognitives. J’aurai certes l’occasion d’y revenir avec plus 
de détails. 

En bref, le discours des dernières années sur l’évaluation formative et 
les préoccupations des praticiens de l’éducation ont permis de révéler que le 
modèle de départ à trois phases, soit 1’ “apprentissage-évaluation-correctif’, 
n’était pas facilement généralisable à des contextes éducatifs autres que ceux 
qui ont servi d’assise à la pédagogie du succès. 

3. VERS UNE LIBÉRATION 

DE L'ÉVALUATION FORMATIVE 


La pédagogie du succès a exercé une telle séduction que l’on a pres¬ 
que cru pendant un certain temps qu’il y avait un lien inséparable entre ce 
type de pédagogie et l’évaluation formative des apprentissages. Pour ce qui 
est de briser ce lien, Allai (1978) a fait oeuvre de pionnière en quelque sorte 
en posant la relation qui pouvait exister entre la méthodologie de l’évaluation 
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formative et les conceptions psychologiques ou psychopédagogiques de l’ap¬ 
prentissage. La séquence de départ n’apparaît déjà plus comme étant la seule 
façon d’intégrer l’évaluation formative aux pratiques pédagogiques puisque 
des démarches non instrumentées, de nature interactive pour ce qui est des 
procédés de régulation, peuvent devenir le lot de plusieurs contextes pédago¬ 
giques. Allai a donné le nom de régulation interactive à cette démarche de gui¬ 
dage continu de la situation d’enseignement et d’apprentissage pour mieux 
l’ajuster aux caractéristiques personnelles des élèves (1979, pp. 135 et 138). 

Les principes de nature docimologique ont formé également une autre 
enclave pour l’évaluation formative. Scallon (1992) a tenté de démontrer que, 
pendant un certain temps, la méthodologie de l’évaluation formative a fait l’ob¬ 
jet d’un discours aux préoccupations de nature purement docimologique com¬ 
me la recherche du nombre minimal de questions à poser dans un exercice et 
la détermination du seuil idéal de réussite et ce, pour départager avec le plus 
de certitude possible les «élèves qui maîtrisent» de ceux «qui ne maîtrisent 
pas» ! D’ailleurs, très peu de procédés de détermination de cet indicateur de 
maîtrise, là où il s’applique, posent comme critère l’efficacité du correctif pres¬ 
crit au regard des élèves qui y ont été assignés. Mais il y a bien plus ! Il est ha¬ 
bituellement reconnu que lors d’un examen, d’un contrôle ou d’un exercice de 
vérification, le portrait de l’élève ne devrait pas être modifié ou altéré. Le prin¬ 
cipe est solidement inscrit dans les moeurs d’évaluation et provient sans 
aucun doute de préoccupations qui doivent caractériser toute opération de 
mesure. Par exemple, en calorimétrie on doit éviter que la chaleur d’un ther¬ 
momètre altère la température que l’on veut mesurer pour un liquide. Voilà 
pour la préoccupation d’ordre docimologique lorsque le portrait à préserver 
est une compétence, une habileté ou un répertoire de connaissances. 

La notion de rétroaction (information en retour ou «feed-back») peut 
se substituer à cette préoccupation. Les démarches de vérification qui propo¬ 
sent aux élèves un corrigé ou un solutionnaire pour vérifier leur performance 
sont de cet ordre. Les instruments conçus pour être utilisés par les élèves mê¬ 
mes de manière à ce que ceux-ci soient placés aux premières loges de la ré¬ 
troaction s’inscrivent nettement dans cette perspective. Les tâches de 
«surlignement» que les élèves doivent effectuer dans certains exercices de 
français écrit avant de fournir une réponse-produit (comme accorder des ver¬ 
bes avec leurs sujets, par exemple) sont également du même ordre (voir 
Tremblay et Demers, 1988 et 1990). On comprendra alors que la rétroaction, 
intégrée à l’ensemble de tâches ou de problèmes que le sujet doit réaliser ou 
résoudre, peut altérer au mieux le portrait de l’élève pendant le déroulement 
même de la démarche d’observation ou de prise d’information. Cette façon de 
voir contraste avec la perspective docimologique et présente plutôt des pré¬ 
occupations de nature didactique ou pédagogique (Scallon, 1992). Et, pour ce 
qui est de soumettre l’évaluation formative à des contrôles de qualité, les re¬ 
cherches menées dans le cadre des diverses applications du feed-back ont 
permis d’asseoir cette pratique d’évaluation sur des bases beaucoup plus ra¬ 
tionnelles qu’empiriques. On peut se permettre d’ajouter que lorsque le feed- 
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back se pose comme destination des actes d’évaluation formative, ceux-ci se 
trouvent libérés en quelque sorte du joug de l’enseignement correctif comme 
en témoignent certains écrits sur le sujet (p. ex., Yeany et Miller, 1983; Pro- 
vencher, 1985). 

Sans aucun doute, les conceptions cognitivistes de l’apprentissage ont 
posé, posent et poseront vraisemblablement des défis majeurs à la pratique de 
l’évaluation formative. Tout semble jusqu’ici s’être joué autour des scénarios 
ou des mises en scène pour ce qui est du rôle des acteurs engagés dans une 
situation d’enseignement et d’apprentissage. Nul doute que l’élève y joue un 
rôle primordial, ce qui ne peut être remis en question. Qu’en est-il de la struc¬ 
ture de ce qui doit être observé ? Par exemple, le produit d’une démarche ou 
le processus même lié à cette démarche ? Et si le «quoi» de l’évaluation for¬ 
mative est relativement facile à déterminer, le « comment » l’est beaucoup 
moins. Il faut admettre que le discours cognitiviste, en dépit de la forte séduc¬ 
tion qu’il a exercé et exerce encore dans les milieux éducatifs, est demeuré as¬ 
sez imperméable aux impératifs de l’évaluation formative, laquelle doit avoir 
pourpoint de départ un processus d’observation. Les définitions opérationnel¬ 
les ne sont pas légion et il ne faut jamais perdre de vue que toute observation, 
voire toute mesure (avant d’arriver à l’évaluation) doit s’alimenter à des indi¬ 
cateurs de surface. Par exemple, la ponctualité n’est pas visible comme telle 
mais les conduites qu’elle entraîne chez les individus le sont. Comme autre 
exemple on ne peut saisir directement l’état d’anxiété d’un individu. Tout au 
plus, peut-on dénombrer des comportements indicateurs d’anxiété. Cette 
contrainte inhérente à toute mesure, et par voie de conséquence à toute dé¬ 
marche d’évaluation, constitue fort probablement une dernière enclave dont 
l’évaluation formative ne peut être facilement libérée. 

On voit donc que tout est en place pour une libération de l’évaluation 
formative des principaux éléments qui lui ont été associés au départ. Elle peut 
être au service de pédagogies autres que la pédagogie de maîtrise, sans pour 
autant renier toute velléité de donner à chaque élève les meilleures chances 
de réussir. La pratique de l’évaluation formative doit aussi être orientée vers 
des préoccupations beaucoup plus didactiques que docimologiques. Enfin, il 
reste à développer des stratégies de collecte d’observations qui permettent de 
retracer des processus, des cheminements empruntés par des élèves et ce, à 
partir d’indicateurs « de surface » qu’il faudra traiter de façon particulière (voir 
le texte de Jean Retschitzki dans le présent ouvrage et celui de Scallon 
(1988b) qui contient un chapitre sur l’observation des erreurs systématiques 
en évaluation formative). Il apparaît de plus en plus évident que cette libéra¬ 
tion correspond étroitement à une préoccupation dominante : celle de fournir 
à chaque élève (et aussi aux enseignantes et aux enseignants) un feed-back 
de qualité. Il reste à démontrer que le développement récent des sciences co¬ 
gnitives vient renforcer cette préoccupation et ouvre des horizons tout à fait 
nouveaux pour la pratique de l’évaluation formative. 
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4. LA RÉGULATION : 

PAS AUSSI SIMPLE QUE L'ŒUF DE COLOMB ! 


Dans les premiers écrits reliés de près ou de loin à la pratique de l’éva¬ 
luation formative, les correctifs à prescrire au sujet d’un rendement inadéquat 
n’ont pas reçu d’étiquette particulière. Le plus souvent, il s’agissait d’assigner 
aux élèves visés des exercices additionnels de pratique ou de leur fournir des 
explications en reprise de l’enseignement initial. Block et Anderson (1975) 
ont décrit toute une panoplie de procédés dits correctifs qui se distinguent se¬ 
lon que l’on mise sur la cognition ou la motivation, sur une approche individua¬ 
lisée ou un travail de groupe, ou encore sur des modalités de présentation du 
matériel. 

Qu’en est-il du mot de plus en plus rencontré de nos jours pour traiter 
de la visée essentielle de l’évaluation formative : la régulation ? Il est assez bi¬ 
zarre de constater que certains répertoires tels le Ouvrent Index of Joumals 
in Education (C.I.J.E.) ne proposent aucun mot clé au titre de régulation 
et que les références à l’enseignement correctif («corrective teaching», 
«remédiai teaching») visent habituellement des programmes entiers de trai¬ 
tement pour des groupes d’élèves présentant des caractéristiques particuliè¬ 
res (p. ex., élèves sous-doués, élèves handicapés, troubles de comportement, 
etc.) ce qui nous éloigne considérablement des limites dans lesquelles il faut 
situer l’évaluation formative des apprentissages. 

Dans le même ordre d’idées, il est relativement facile de constater que 
la pratique même de l’évaluation formative en milieu scolaire a connu des dé¬ 
rapages importants. C’est ce qui se dégage d’un rapport du Conseil supérieur 
de l’éducation du Québec dans lequel l’évaluation des apprentissages au pri¬ 
maire fait l’objet d’un tour d’horizon (1992). Il serait laborieux de décrire tous 
les aspects traités dans ce document mais il apparaît de toute évidence, pour 
ce qui est de la pratique de l’évaluation formative telle que signalée dans le 
rapport, que la notion de régulation n’est pas toujours à l’avant plan des pré¬ 
occupations du milieu et il n’est même pas certain qu’elle soit bien comprise. 

Le terme «régulation» semble émerger de certains écrits européens, 
puisqu’on le trouve au centre de travaux de réflexion sur l’évaluation formati¬ 
ve notamment ceux de Allai (1978) et de Cardinet (1986). La définition for¬ 
melle de la régulation, trouvée dans un dictionnaire, se lit comme suit à propos 
d’un dispositif ou d’un mécanisme : 

Fait d’en régler le fonctionnement ou le mode de fonctionnement, 

notamment pour l’adapter aux conditions extérieures ou au résultat 

à obtenir (CNRS, 1990). 

Cette définition n’ajoute rien à la compréhension actuelle de ce que 
doit être la régulation. Les synonymes qui s’y rapportent sont tout de même 
intéressants et devraient aider à se saisir de cette notion importante : régler, 
adapter, ajuster, contrôler, ou mettre au point.. 
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À mon humble avis, la notion de régulation mérite d’être bien mise en 
évidence pour aborder la façon de concevoir la pratique de l’évaluation forma¬ 
tive dans des contextes pédagogiques autres que ceux qui lui ont donné nais¬ 
sance. Lorsque la question de l’évaluation formative est posée on doit 
maintenant se tourner vers une question beaucoup plus précise : La 
régulation : c’est l’ajustement de qui ou de quoi ? De l’élève pour que celui- 
ci s’accorde à un ensemble d’objectifs bien planifiés ? Des actions pédagogi¬ 
ques et didactiques pour mieux les adapter aux caractéristiques personnelles 
des élèves ? Tel est pour l’instant l’enjeu qui se présente à toute clarification 
des visées de l’évaluation formative en milieu scolaire. 

L’auteur de ce texte a voulu tester la définition donnée ci-haut de la 
régulation en essayant de visualiser un épisode typique d’une pédagogie de si¬ 
tuation inspirée de travaux tout récents en didactique de la lecture (Demers 
et Tremblay, 1992; Tremblay et Scallon, 1994). Il s’agit essentiellement d’une 
pédagogie qui offre aux élèves des moments de lecture libre, des moments de 
lecture guidée et des projets de lecture autonome. C’est à l’occasion de projets 
de lecture autonome que les élèves sont sollicités pour une démarche de véri¬ 
fication de leur capacité de lecture. Ils sont d’abord saisis d’une tâche à réali¬ 
ser (p. ex., apprendre des règles pour réaliser un jeu, démarrer une collection 
de pierres, compléter une fiche sur un animal, etc.). Chaque projet comporte 
une mise en situation à laquelle tous les élèves de la classe participent simul¬ 
tanément, une période de lecture autonome (travail individualisé) et un re¬ 
tour collectif sur le parcours de lecture, sur la réussite de la tâche et sur 
l’expérience vécue par les élèves. L’approche n’est pas exclusive à la didacti¬ 
que de la lecture car l’apprentissage par problèmes en médecine présente une 
mise en scène comparable : saisie d’un cas clinique en petit groupe en présen¬ 
ce d’un professeur, recherche d’informations pertinentes et recours à des 
stratégies appropriées sur une base individuelle, retour en groupe pour analy¬ 
ser le diagnostic à poser et échanger sur les difficultés de parcours. Berkson 
(1990) a présenté une description très élaborée de ce qui se présentait au dé¬ 
part comme une approche pédagogique et qui est devenue un programme de 
formation en médecine. 

Pour rendre compte des divers moments de régulation dans un épiso¬ 
de de pédagogie de situation, la figure 1 présente les ajustements réalisables 
depuis le point de départ (la saisie du projet à réaliser) jusqu’au retour ré¬ 
flexif. Le corps de cette figure rappelle que l’accomplissement de la tâche dé¬ 
pend de la maîtrise de plusieurs éléments empruntés au vocabulaire des 
sciences cognitives : connaissances déclaratives, connaissances procédurales, 
stratégies, habiletés (skills), etc. On comprendra toutefois que la maîtrise de 
ces éléments n’est pas exigée avant d’aborder un projet, comme en pédagogie 
de maîtrise. On ne peut cependant nier leur importance pour réaliser la tâche 
avec succès. C’est en suivant le parcours présenté dans la figure 1 que l’on 
peut mettre en évidence toute l’étendue du registre des régulations qui s’of¬ 
frent à une pédagogie de situation : 
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• au départ : le projet doit correspondre au niveau de compétence et aux 
caractéristiques des élèves en général; la clarté des consignes, certains 
aspects du projet et les explications fournies doivent être objets de réglage et 
ce, dès le début du projet. 

Le bien fondé du projet doit être expliqué pour susciter la motivation des élè¬ 
ves; les difficultés à surmonter doivent être perçues de façon telles que les 
élèves éprouvent un sentiment de «contrôlabilité» de la tâche; ici encore plu¬ 
sieurs réglages sont possibles et peuvent même être anticipés lors de la plani¬ 
fication. Cette phase est cruciale car c’est bien la tâche à réaliser qui donne 
aux élèves une intention de lecture dans ce type de pédagogie. De plus, c’est 
le résultat à obtenir ou le but à atteindre qui doit donner emprise à la régula¬ 
tion ou à l’autorégulation. 

• en cours de route : connaissances, habiletés, stratégies sollicitées d’un pro¬ 
jet à l’autre peuvent faire défaut; l’ajustement ici peut être envisagé en terme 
de consolidation par la pratique au moyen d’exercices structurés à visée 
didactique (feed-back); par exemple, une difficulté éprouvée par plusieurs 
élèves déclenchera le recours à une démarche instrumentée pour vérifier de 
façon formelle l’utilisation adéquate de certaines stratégies 

Lecture et réalisation de la tâche sur le plan individuel ; on est au cœur du 
projet où l’autonomie de chaque élève est le plus sollicitée : surveillance 
étroite par l’élève de son cheminement (monitoring) et remise en question en 
fonction du résultat à obtenir (régulation menée après autoévaluation ou 
activité de métacognition). 

• au retour : rétroaction sur le parcours suivi par chaque élève, sur l’utilisation 
de ses propres ressources et de celles mises à sa disposition et rétroaction 
sur la réussite du projet; ajustements à long terme en préparation de projets 
à venir. La mise en scène en est une basée sur des échanges en classe. 

La lectrice et le lecteur intéressés trouveront une présentation beau¬ 
coup plus détaillée et nuancée dans un ouvrage récent paru au regard de cette 
didactique de la lecture (voir Tremblay et Scallon, 1994). 

La démarche qui vient d’être décrite fait voir assez clairement le dou¬ 
ble objet de la régulation et le rôle des acteurs en présence. D’une part, on voit 
que la situation pédagogique, c’est-à-dire le projet et ses éléments, est objet 
de régulation dès le départ. D’autre part, la démarche de l’élève avec ses con¬ 
naissances, ses habiletés et sa motivation est aussi traitée comme un objet im¬ 
portant de régulation. Enfin, il serait superflu d’insister sur le rôle de 
l’enseignant et celui des élèves dans la mise en oeuvre des multiples actions 
d’évaluation et de régulation. 
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ajustements , ajustements à long terme : 

de la situation de départ DEPART : 

- c — retour sur la tache 



Figure 1 

Événements de régulation dans une pédagogie de situation 


5. L'APPORT DES SCIENCES COGNITIVES : 
QUELS MATÉRIAUX NOUVEAUX 
POUR L'ÉVALUATION FORMATIVE ? 


Situer les objets de réglage, d’ajustement ou de régulation, dans une 
pédagogie aux parcours encore inédits, inspirée des théories de l’apprentissa¬ 
ge du dernier cri, est une chose. Savoir sur quels indices visibles jeter son re¬ 
gard, sur quelles bribes d’information fonder une décision ou encore dans 
quelle direction précise diriger son attention en est une toute autre. Et les en¬ 
seignants doivent savoir et les élèves aussi car, d’après ce qui vient d’être écrit, 
ce sont les principaux acteurs qui sont engagés dans la pratique de l’évalua¬ 
tion formative. 

Jusqu’ici les apprentissages cibles de l’évaluation formative ne se sont 
pas tellement différenciés de ceux habituellement visés par l’évaluation en 
général : soit des résultats à atteindre exprimés le plus clairement possible 
sous forme d’objectifs d’apprentissage. Des taxonomies et diverses tentatives 
de classification se sont accumulées au fil des ans comme en faisait foi un bilan 
mené en 1975 par De Landsheere et De Landsheere. Mais aucune de ces clas- 
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sifications ne semble avoir influencé les pratiques d’évaluation au point d’im¬ 
poser des subtilités de nature méthodologique qui puisse différencier 
nettement l’évaluation formative d’autres fonctions de l’évaluation. 

Mais qu’en est-il des propositions venant du domaine des sciences co¬ 
gnitives. Des écrits récents faisant état des problèmes relativement nouveaux 
qui se posent à l’appréciation d’habiletés cognitives sont très indicateurs à ce 
sujet. Par exemple, au-delà de la simple mesure des connaissances au moyen 
de techniques de rappel (i.-e. avec des tâches de restitution de réponses ap¬ 
prises par exemple) on semble s’intéresser de plus en plus à leur structure ou 
à leur organisation chez les élèves (Royer, Cisero et Carlo, 1993). Dans le cas 
de procédures à faire suivre par des sujets, on peut s’intéresser non seulement 
à l’exactitude de leur exécution mais aussi au degré d’automaticité avec lequel 
elles ont été effectuées (Anderson, 1982). Et la liste des éléments nouveaux, 
voire inédits, pourrait s’allonger davantage. La figure 2 fournit un aperçu des 
divers éléments empruntés au domaine des sciences cognitives et avec les¬ 
quels il faut composer pour ajuster les pratiques d’évaluation des apprentissa¬ 
ges. On remarquera que le domaine est encore en friche et qu’ü ne semble pas 
y avoir de principe unificateur qui puisse orienter dans une direction commu¬ 
ne tous les investissements méthodologiques à venir. 


ANDERSON, J.-R. (1982) 


IBENTON et KIEWRA(1987) 


KRAIGER, FORD et SALAS (1993) 


connaissances déclaratives 

productions 

automaticité 


GAGNE, R. M. (1984) 


connaissances déclaratives 
connaissances procédurales 
processus de contrôle 
stratégies cognitives 
métacognition 


habiletés intellectuelles 
information verbale 
stratégies cognitives 
habiletés motrices 
attitudes 


|TARDIF, J. (1992) 

• connaissances 

déclaratives 

procédurales 

conditionnelles 


[BRIEN, R. (1990) [ 

• représentation 
des connaissances 

schémas, concepts, 
propositions, épisodes 
règles de production 
procédures, heuristiques, 
blocs de connaissances 
savoirs, savoir-faire 


• métacognition 

connaissance et contrôle 
stratégies cognitives et 
facteurs affectifs 

• motivation scolaire 

systèmes de conception 
systèmes de perception 


• compétences humaines 

reproduction, production 


• cognition 

connaissances verbales 
organisation des connaissances 
stratégies cognitives 

• habiletés 

compilation 

automaticité 

• affectivité 

attitudes 

motivation 


[ROYER, CISERO et CARLO (1993) 

• l'appréciation 
des habiletés cognitives 

acquisition des connaissances 
organisation et structure 
représentation d'un problème 
qualité des modèles mentaux 
efficacité des procédures 
automaticité de la performance 
habiletés métacognitives 


• affectivité 

motivation, attitudes 


Figure 2 

Aperçu des mots dés utilisés dans quelques ouvrages récents se rapportant au 
domaine des sciences cognitives 
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Il n’est pas dans le cadre de ce texte de reprendre une à une les com¬ 
posantes qui pourraient servir de cibles à l’évaluation formative et d’en traiter 
avec profondeur. Tout au plus pouvons nous envisager d’une manière pure¬ 
ment hypothétique ce que l’avenir nous réserve. Pour y arriver, certaines 
questions doivent être élucidées. 

La très grande majorité des textes qui ont été consultés au regard des 
procédés d’observation et d’appréciation (assessment) inspirés par les scien¬ 
ces cognitives s’adressent beaucoup plus à l’évaluation pronostique ou dia¬ 
gnostique qu’à l’évaluation formative. En complément à cette perspective, les 
recencions d’écrits de nature méthodologique ont plutôt fait état des procédés 
utilisés pour évaluer des programmes d’intervention ou des moyens d’ensei¬ 
gnement (p. ex., Benton et Kiewra, 1987; Kraiger, Ford et Salas, 1993; Royer, 
Cisero et Carlo, 1993). Pour ce qui est de la pratique de l’évaluation formative, 
la nuance est importante, tant du point de vue méthodologique et du point de 
vue des actions à poser. Beaucoup de caractéristiques d’intérêt, telles la struc¬ 
ture des connaissances ou des concepts par exemple, exigent des procédés 
élaborés de cueillette d’informations et de traitement de données qui ne sont 
certes pas à la portée des enseignantes et des enseignants au contact d’une 
classe d’élèves. C’est ainsi que se présente le degré d’organisation des connais¬ 
sances dans la structure cognitive d’un élève, l’un des cas les mieux documen¬ 
tés dans les écrits. De plus, les possibilités de régulation des divers 
phénomènes d’intérêt sont pour la plupart méconnues et les écrits en évalua¬ 
tion diagnostique n’ont pas cette préoccupation. On voit donc tout le problè¬ 
me qui doit se poser à la formation des maîtres lorsqu’il s’agira de leur 
proposer des cibles nouvelles pour l’évaluation formative, cibles empruntées 
à un domaine encore en émergence comme celui des sciences cognitives. 


6. LA LUMIÈRE AU BOUT DU TUNNEL : 
LA MÉTACOGNITION 


Pour l’instant, d’après l’état actuel de nos connaissances, il n’est pas 
certain que les diverses habiletés et les stratégies cognitives aient été 
«pédagogisées» à ce point qu’elles puissent être apprises ou enseignées pour 
être traitées éventuellement de simples objets de régulation. Par exemple, Ro¬ 
mainville (1993) a mis en doute d’une certaine manière la possibilité d’entraî¬ 
ner des sujets à utiliser des stratégies d’étude (p. 38 et suivantes). La critique 
s’applique-t-elle également à tout un registre d’habiletés diverses ? Les textes 
recensés ne sont pas explicites sur ce point mais on peut l’inférer facilement 
dans le cas de l’ouvrage de Tardif (1992) traitant plus particulièrement de 
l’enseignement de stratégies. Cependant, nombre de variables d’intérêt qui 
alimentent le discours des sciences cognitives sont actuellement traitées le 
plus souvent dans le cadre de recherches exploratoires ou dans celui de l’at¬ 
testation de l’efficacité de programmes d’intervention auprès de clientèles à 
problème ou en difficulté. Si l’importance à accorder à ces variables (on peut 
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penser ici au sentiment d’efficacité personnelle, ou à l’attribution causale par 
exemple) faisait en sorte qu’elles doivent se situer en amont de tout program¬ 
me de formation, elles seraient alors la matière première de l’évaluation dia¬ 
gnostique beaucoup plus que de l’évaluation formative. Or, «l’éducabilité» de 
certaines de ces caractéristiques commence à se manifester à l’horizon de nos 
préoccupations. C’est le cas notamment des changements apportés au systè¬ 
me d’attribution causale des individus en relation avec une structure de feed¬ 
back ou de notation plus personnalisée, voire dans certains cas, critérielle 
(Oren, 1983; Covington et Omelich, 1984; McColskey et Leary, 1985; Butler et 
Nisan, 1986). Tardif (1992) rapporte plusieurs études qui auraient obtenu des 
effets positifs pour l’enseignement de stratégies de résolution de problèmes 
(pp. 251 et suiv.). Ce ne sont là, bien sûr, que quelques pistes de réflexion et 
il faudrait consacrer beaucoup plus de lignes que les limites de ce texte n’auto¬ 
risent. 


De tous les éléments mis en évidence ces dernières années ü en est 
un qui semble persister et même résister à tous les courants : il s’agit de 
l’autoévaluation. Si certaines personnes ont cru assister à l’émergence d’une 
mode ils peuvent maintenant modifier leur perception car c’est devenu un 
pôle d’attraction fort documenté et il serait difficile pour ne pas dire presque 
impossible de rendre compte de l’abondance des écrits qui en ont traité. Dans 
le cadre de ce texte, qu’il soit dit que l’autoévaluation se conçoit fort bien com¬ 
me une modalité d’appropriation de l’évaluation formative mais aussi (et cer¬ 
tains diraient d’abord et avant tout) comme un outil indispensable à toute 
entreprise de formation. C’est ainsi qu’il fallait interpréter la conception déve¬ 
loppée par certains chercheurs d’Aix-en-Provence au milieu des années’80 et, 
lors d’une rencontre qui m’a été des plus profitables, je me suis permis d’utili¬ 
ser l’étiquette d’«évaluation formatrice» pour cerner une conception de l’éva¬ 
luation formative fort distincte de celle des pionniers. L’idée de faire de 
l’évaluation formative une habileté à développer chez les élèves, un savoir 
être, a été fort bien élaborée et soutenue par Nunziati (1990). 

Dans son évolution comme concept, au travers des années, l’autoéva- 
luation est apparue de plus en plus comme un fil directeur et un lieu de néces¬ 
sité qui en a imposé de plus en plus à la méthodologie de l’évaluation 
formative. En effet, nul ne saurait aujourd’hui se contenter d’une approche 
globale et superficielle qui ferait de l’autoévaluation une simple affaire d’im¬ 
pression générale, ou un état d’âme dont l’individu est plus ou moins cons¬ 
cient. Dans le cadre de certaines pédagogies de situation on l’a vue être 
greffée à des productions complexes mais concrètes telles qu’il s’en trouve 
dans le domaine de l’enseignement professionnel (par exemple, au Québec) 
ou encore en français langue maternelle. Le concept «d’objectivation des pra¬ 
tiques de communication», tel qu’entendu dans les programmes de français 
(primaire et secondaire) du Ministère de l’éducation au Québec, était et est 
encore nettement de cet ordre. Cependant, pour écourter un peu l’histoire et 
l’évolution des idées, la notion d’autoévaluation semble avoir été associée au 
départ à celle de production élaborée que l’élève doit réaliser dans un contex- 
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te de relative autonomie (cf. Leselbaum, 1982). Qu’en est-il de l’autoévalua- 
tion par l’élève de ses connaissances sans passer par un jugement 
impressionniste ? Qu’en est-il de l’autoévaluation de certaines habiletés cogni¬ 
tives que l’on peut cerner avec des épreuves à correction objective ? Il faut re¬ 
connaître que, pendant plusieurs années, le discours et la pratique de 
l’autoévaluation sont demeurés assez imperméables à ces réalités diverses. 

La notion de «métacognition» est venu jeter un éclairage tout à fait 
nouveau au regard de toutes ces questions. Savoir que l’on comprend, que l’on 
sait, que l’on sait faire, apparaît de plus en plus être à la base de l’autoévalua- 
tion. S’évaluer (ou s’autoévaluer) au sujet d’une prestation en tenant compte 
de plusieurs points de vue ou de plusieurs critères est une chose; s’évaluer 
dans le but de poser des gestes de nature corrective, dans le but de s’ajuster 
(et on parle ici de régulation faite par l’individu lui-même c’est-à-dire d’auto¬ 
régulation) en est une toute autre. Une telle évaluation doit être réaliste ou 
encore menée avec «justesse». C’est ici, énoncé un peu brutalement, que la 
métacognition entre fort probablement en jeu puisque s’autoévaluer avec jus¬ 
tesse c’est précisément savoir que l’on sait (quand on sait) ou que l’on ne sait 
pas (quand on ne sait pas). C’est sans doute ainsi que Allai (1993) traite du 
processus de régulation métacognitive et de la place qu’il devrait occuper dans 
l’évaluation formative par l’élève. L’auteur propose un canevas qui pourrait 
s’avérer utile pour articuler une démarche d’autoévaluation : une phase d’an¬ 
ticipation constituée d’activités de prévision pour orienter l’action, une phase 
de contrôle consistant en un processus continu de comparaison entre un état 
donné et un résultat à atteindre (monitoring) et une phase d’ajustement (la 
régulation proprement dite). Dans ce paradigme il revient à l’évaluation for¬ 
mative de soutenir divers niveaux d’autorégulation (Allai, 1993, pp. 88-89). 

Il est un autre aspect intéressant à souligner lorsqu’on situe la méta¬ 
cognition au coeur d’une pratique d’évaluation formative qui fait de celle-ci 
une habileté fondamentale à développer chez les élèves. Il apparaît de plus en 
plus, d’après l’opinion explicite de certains chercheurs, que la métacognition 
peut être «éducable» ou encore «pédagogisable» au-delà du seul fait qu’elle 
se développe avec l’âge. Chez quelques auteurs qui ont attiré l’attention sur ce 
point, on parle de «conscience métacognitive» (Noël, 1991) ou de «prise de 
conscience de son fonctionnement» (Romainville, 1993). Cette conscience 
peut être objet d’entraînement ou d’action pédagogique et Romainville, dans 
cette perspective, a beaucoup insisté sur l’importance du feed-back ou infor¬ 
mation en retour (1993, pp. 59-60). 

Pour récapituler, en bref... 

Tout en maintenant le cap sur la régulation de l’apprentissage, les con¬ 
ceptrices et les concepteurs du discours sur l’évaluation formative nous ont 
proposé des savoir-faire variés qui reflètent assez bien diverses conceptions 
de la pédagogie et aussi diverses représentations de ce qui doit être objet 
d’ajustements ou de réglages. On a vu assez rapidement que les premières ver- 
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sions méthodologiques devaient répondre aux impératifs d’une pédagogie 
centrée sur des objectifs bien circonscrits avec en plus le souci de démocrati¬ 
ser le plus possible la maîtrise de ces objectifs. L’avènement de pédagogies 
plus complexes, centrées sur des objets tout aussi complexes (apprentissage 
par problème ou pédagogie de situation, par exemple) ont quelque peu ébran¬ 
lé une méthodologie qui n’a pu se poser comme tradition. C’est dans cette dy¬ 
namique de changement constant de définition et d’orientation que le 
domaine des sciences cognitives a pu influencer et influencera davantage la 
pratique de l’évaluation formative. Non pas que ce type d’évaluation devienne 
altéré conceptuellement ! 

C’est plutôt dans l’ordre de ses appropriations qu’il faut diriger toute 
notre attention. L’autoévaluation, la prise en charge de ses apprentissages et 
de sa progression par l’élève et au mieux la possibilité de poser elle-même ou 
lui même ses propres actions de régulation est sans contredit l’appropriation 
la plus marquée. Si bien des caractéristiques relativement nouvelles émergent 
du discours des sciences cognitives (connaissances déclaratives, procédura¬ 
les, conditionnelles, etc.) la métacognition se présente déjà comme un centre 
d’intérêt tant pour la recherche des prochaines années que pour la pratique 
pédagogique. L’évaluation formative ne pourra que bénéficier de la jonction 
entre le traitement plus approfondi de cette conscience de ses processus co¬ 
gnitifs ou de ses démarches de la part de l’élève, de l’étudiant, d’une part, et 
les phénomènes d’autoévaluation et d’autorégulation qui ont été mis en évi¬ 
dence depuis plusieurs années. 




Analyse des pratiques éducatives 
visant à faire participer l'apprenant 
à l'évaluation diagnostique, 
au pilotage et à la régulation 
de ses apprentissages 


José-Luis Wolfs 


176 La métacognition 


Introduction 

Les pratiques éducatives visant à amener les élèves à piloter, auto- 
évaluer et réguler leurs apprentissages se sont fortement développées ces 
dernières années. L’objectif de ce texte est de proposer un instrument per¬ 
mettant d’analyser ces pratiques, en référence essentiellement aux travaux 
relatifs à la métacognition. 


1. LA PARTICIPATION DE L'ÉLÈVE 

À L'ÉVALUATION DIAGNOSTIQUE, AU PILOTAGE 
ET À LA RÉGULATION DE SES APPRENTISSAGES 


Les pratiques pédagogiques qui visent à aider l’élève à participer de 
manière aussi active et autonome que possible au pilotage, à l’évaluation et à 
la régulation de ses apprentissages se sont fortement développées ces derniè¬ 
res années, ainsi qu’en témoignent : 

- les travaux des chercheurs en Sciences de l’Education (ex : Allai, 
1988, Allai, 1993, Bonniol, 1981, De Ketele, 1991, Laveault, 1990, Le¬ 
clercq, 1991, Paquay, Allai, Laveault, 1990...); 

- les recommandations officielles émanant de pouvoirs organisateurs 
d’enseignement (ex : une publication de la Commission de Rénovation 
de l’Enseignement fondamental consacrée à l’évaluation formative et 
à l’auto-évaluation, Ministère de l’Education en Belgique francophone, 
à paraître prochainement); 

- les ouvrages consacrés à ce thème et destiné aux enseignants (Lesel- 
baum, 1982, De Vecchi, 1992...). 

Il apparaît non seulement que ces pratiques sont extrêmement diver¬ 
sifiées, mais qu’en outre les mêmes termes recouvrent parfois des réalités très 
différentes. Ainsi, comme le notait De Ketele, dans un article intitulé avec hu¬ 
mour «Ballade au pays de l’auto-évaluation», certaines pratiques se récla¬ 
mant de l’auto-évaluation conduisent en fait à la dépendance alors que 
d’autres favorisent l’autonomie. 

C’est pourquoi, il nous paraît judicieux de tenter de proposer un ins¬ 
trument d’analyse des différentes pratiques visant - au sens large - à aider les 
élèves à piloter, auto-évaluer et réguler leurs propres apprentissages. Avant 
de développer les différents critères que nous suggérons (dans la troisième 
partie de cet article), nous nous efforcerons de clarifier et de systématiser le 
concept de métacognition, qui sous-tend, explicitement ou non, la plupart 
d’entre elles. 
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2. LA MÉTACOGNITION 

2.1 Origine du concept 

L’émergence et le développement du concept résultent de la conver¬ 
gence de plusieurs courants : recherches de Flavell (1976) sur la mémoire et 
la métamémoire, de Piaget (1974) sur la prise de conscience, de Vygotsky sur 
les origines sociales du contrôle cognitif, de Sternberg sur le processus de con¬ 
trôle dans le traitement de l’information. 

Toutefois, c’est Flavell (1979) qui a le plus contribué à populariser le 
concept de métacognition. Sa définition englobait deux composantes 
(«knowledge and cognition about cognitive phenomen» / «cognitive 
monitoring») qui ont été reprises par la plupart des auteurs ultérieurs. 

Gombert (1990), en particulier définit la métacognition comme suit : 
«Domaine qui regroupe : (1 ) les connaissances introspectives conscien¬ 
tes qu’un individu particulier a de ses propres états et processus cogni¬ 
tifs, (2) les capacités que cet individu a de délibérément contrôler et 
planifier ses propres processus cognitifs en vue de la réalisation d’un but 
ou d’un objectif déterminé. » 

Dans un souci de rendre opérationnel le concept, la définition de 
Gombert a le mérite, comme le suggéraient déjà Kitchener (1983) et Noël 
(1988), d’insister sur le fait que les connaissances métacognitives sont intros¬ 
pectives et portent sur le fonctionnement cognitif du sujet lui-même. Elles 
doivent être clairement distinguées des connaissances d’ordre général relati¬ 
ves aux phénomènes cognitifs (psychologie, épistémologie...) que le sujet 
pourrait en outre avoir. Ces dernières peuvent bien entendu devenir métaco¬ 
gnitives à leur tour, si le sujet les utilise pour analyser son propre fonctionne¬ 
ment cognitif. 

Nous tenterons à présent, en nous référant essentiellement à un mo¬ 
dèle élaboré en commun avec Noël et Romainville (Noël, Romainville, & Wolfs, 
à paraître) de décrire schématiquement ses différentes modalités de fonction¬ 
nement en distinguant bien les deux dimensions retenues par la plupart des 
auteurs : connaissances métacognitives et contrôle métacognitif (ou régula¬ 
tion), car comme nous le montrerons plus loin, ces deux dimensions ne sont 
pas toujours liées. 

En ce qui concerne le problème des régulations, signalons un intéres¬ 
sant article de Allai (1993), où l’auteur tente d’articuler les différents types de 
régulations dans une perspective systémique : régulations d’ordre institution¬ 
nelles, régulations entre l’enseignant et l’élève ou entre élèves et régulations 
métacognitives (propres au sujet lui-même). 

2.2 Modalités de fonctionnement de la métacognition 

Nous distinguerons schématiquement trois grands types de situations 
que nous développerons ci-après : 
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- situation 1 : régulation de l’activité cognitive sans intervention d’une 
réflexion métacognitive; 

- situation 2 : développement d’une réflexion métacognitive; 

- situation 3 : réflexion métacognitive et régulation. 

2 . 2.1 Situation 1 : régulation de l'activité cognitive 
sans intervention d'une réflexion métacognitive 

Nous pouvons distinguer deux cas : 

CAS 1 : Le sujet (ici l’apprenant) contrôle ou régule ses activités co¬ 
gnitives en utilisant des processus implicites (dans le sens de Dulany, 1984) 
ou des processus automatisés, sans intervention d’une réflexion métacogniti¬ 
ve. 


Exemple de processus automatisés (cité par Gombert, 1990) : 

«Tout d’abord, l’acte graphique lui-même, le choix des mots, l’or¬ 
thographe, les accords grammaticaux, la ponctuation, sont souvent opé¬ 
rés automatiquement. De même, la recherche de cohérence et de cohésion 
textuelle, l’adaptation au lecteur potentiel ne font pas toujours l’objet 
d’une attention particulière alors que le texte sera satisfaisant sur ces 
critères. Enfin, Bartlett (1982) signale que de nombreuses corrections 
sont effectuées si rapidement que les sujets n’ont pas pu réfléchir sur la 
nature du problème. Tout porte à penser qu’il s’agit là de processus auto¬ 
matisés, cette automatisation permettant que la plus grande part de l’ef¬ 
fort cognitif soit consacré à l’élaboration du contenu. Il est toutefois 
notable que chacune de ces activités peut être contrôlée délibérément si 
la situation l’impose ou si un obstacle survient dans la rédaction. Ceci 
suggère que, dans l’apprentissage, l’automatisation a été consécutive à 
une maîtrise consciente puis à un exercice de ces différents 
composants. » 

D’une manière plus générale, une situation de nouveauté, de difficul¬ 
té, de «déséquilibre cognitif» serait propice à l’exercice d’une réflexion méta¬ 
cognitive. A l’inverse, une tâche familière et répétitive conduirait à 
l’automatisation progressive de « routines » de comportements. 

CAS 2 : Les activités cognitives du sujet sont guidées par une procé¬ 
dure, une marche à suivre fournie de l’extérieur. 

Exemple : C’est le cas de certaines grilles qui prescrivent à l’appre¬ 
nant une marche à suivre très précise, sans l’inviter à expliciter, analyser ou 
évaluer sa démarche. 

Dans les cas 1 et 2, il apparaît clairement un contrôle et une régulation 
des activités cognitives ou des apprentissages, sans toutefois qu’intervienne 
une réflexion métacognitive, si ce n’est incidemment. 
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2 . 2.2 Situation 2 : le sujet développe 
une réflexion métacognitive 

Nous pouvons distinguer - schématiquement - plusieurs activités 
métacognitives : l’explicitation (évocation, description par le sujet de ses 
processus cognitifs), l’analyse (mise en relation entre plusieurs processus, 
entre processus et variables contextuelles, entre processus et résultats...), la 
conceptualisation : abstraire de différentes situations analysées des proprié¬ 
tés générales relatives à son propre fonctionnement, des règles d’action ou 
stratégies applicables à différents contextes. 

Ces différentes activités métacognitives d’un sujet peuvent porter sur 
différents objets : son propre fonctionnement cognitif (passé, présent ou fu¬ 
tur) d’une part ou les variables externes qui influencent celui-ci d’autre part. 
Enfin, ces activités peuvent se dérouler selon un mode descriptif ou un mode 
évaluatif Dans ce dernier cas, le sujet émet un jugement sur la qualité de son 
fonctionnement cognitif. 

Pour illustrer ces différentes formes de réflexion métacognitive, nous 
citerons quelques exemples de réponses fourmes par des étudiants de pre¬ 
mière année d’études universitaires à deux enquêtes : l’une portant sur les 
comportements d’étude et de préparation aux examens en général (Fonteyn, 
1993) et l’autre portant sur la prise de notes en particulier (Lona, 1994). 


Illustration : 

(1) L’explicitation : 

Explicitation / mode descriptif /fonctionnement personnel 

- «Dans ma prise de notes, j’écoutais d’abord la phrase entière avant 
d’écrire...» 

- «... en abrégeant un maximum de mots » 

- «... j’ai privilégié les flèches » 

Explicitation / mode descriptif / variables externes 

- «J’ai surtout tenu compte de ce que le professeur projetait à 
l’écran» 

- «... sur lesquelles le professeur a insisté » 

- «... vu la lecture rapide » 

Explicitation / mode évaluatif/fonctionnement personnel 

- «Je me suis trop basée sur le mot-à-mot. » 

- «... c’est comme ça que je fais et ça m’a réussi» 

Explicitation / mode évaluatif /variables externes 

- «Le professeur ne facilitait pas la prise de notes. » 
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(2) L’analyse 

L’étudiant exprime des relations (cause, conséquence, temps, but/ 
avantage, moyen, condition, alternative, opposition, restriction...) en¬ 
tre processus cognitifs, entre ceux-ci et des variables contextuelles, 
entre processus et résultats... (Pour plus d’informations sur l’activité 
d’analyse, voir Romainville, 1992, 1993.) 

Analyse/Mode descriptif /Fonctionnement personnel 

- «Ne pas étudier quelque chose d’incompris car on ne le retient 
pas.» (Conséquence). 

- «Le fait de relire le cours et ses notes permet de voir si effective¬ 
ment tout est bien compris.» (But/avantage) 

- «Reformuler autrement s’il y a incompréhension» (Condition) 

- «Assister au cours... cela pallie le manque d’étude régulière du 
syllabus.» (Alternative) 

Analyse / Mode descriptif/ Variables externes 

- «... lorsqu’il m’arrive de ne pas avoir le temps d’écrire mes 
phrases.» (Condition) 

- «Structurer le cours (...) Attention toutefois à ne pas donner trop 
d’importance au support matériel. » (Restriction) 

- «... car c’était un travail à rendre et non des notes personnelles» 
(Opposition) 

Analyse /Mode évaluatif/Fonctionnement personnel 

- «Recopier ses notes : j’ai une mémoire visuelle, donc je mémorise 
très facilement de la sorte». (Cause) 

- «En faisant ressortir les points essentiels de la sorte, j’ai déjà une 
idée assez précise du contenu lorsque je reverrai mes notes par la 
suite.» (Moyen) 

- « La raison pour laquelle j’essaie de noter le plus possible est que je 
ne retiens pas longtemps les mots entendus.» (Cause) 

Analyse / Mode évaluatif/ Variables externes 

- «... Il est impossible d’ingurgiter la matière telle qu’elle est présen¬ 
tée dans le syllabus. » (Opposition) 

- «Ceci n’était pas difficile, dans la mesure où cette activité se faisait 
entre copains, dans un climat de détente. » (Condition) 

(3) La conceptualisation 

Ici aussi, nous pourrions proposer - en principe - des exemples illus¬ 
trant les différentes sous-modalités de cette activité : mode descriptif/ 
évaluatif, fonctionnement personnel/variables externes. Toutefois, 
nous nous en abstiendrons provisoirement, dans la mesure où il est 
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extrêmement difficile à partir d’extraits de réponse cités hors contex¬ 
te, de savoir s’il y a eu effectivement conceptualisation ou non. 

Considérons les extraits suivants : 

- «Il est toujours plus facile d’étudier ses propres notes. » 

- «On se rappelle mieux les choses contre lesquelles on a des griefs, 
auxquelles l’on a réfléchi. » (Cette réflexion d’un étudiant rappelle 
une des pensées de PASCAL qui disait - en substance - ; «On se 
persuade davantage des raisons que l’on a soi-même trouvées que 
de celles qui nous ont été données. ») 

Tous ces énoncés possèdent un haut degré de généralité, toutefois, il 
est difficile de savoir dans quelle mesure ils sont le fruit d’une abstrac¬ 
tion portant sur de nombreuses expériences personnelles dûment 
analysées ou si l’étudiant reprend simplement à son compte une 
croyance, un lieu-commun. (Ex : «Il y des méthodes clés pour réussir 
à l’Université. Le plan, le résumé, la logique, la synthèse font partie de 
ces méthodes. ») 

C’est pourquoi, vu la difficulté d’opérationaliser les activités de con¬ 
ceptualisation, nous nous limiterons dans notre analyse des outils pé¬ 
dagogiques proposés aux élèves, à distinguer les questions qui 
renvoient à un contexte spécifique bien défini («Comment as-tu fait 
hier soir pour étudier ta leçon de géographie ?») et celles qui sont dé¬ 
contextualisées (« Comment fais-tu habituellement pour étudier tes 
leçons ?»). 

2 . 2.3 Situation 3 : Réflexion métacognitive et régulation 

Le sujet utilise sa réflexion et ses connaissances métacognitives pour 
contrôler et réguler ses activités. En fonction des résultats obtenus, certaines 
de ses connaissances ou stratégies métacognitives se voient renforcées (vali¬ 
dées) ou au contraire remises en question et modifiées. 

Pour schématiser encore plus ces différentes modalités de fonction¬ 
nement, nous pourrions les résumer comme suit : 

1. le sujet se trouve en situation de “pilotage automatique” (situation 
1, cas 1) : 

2. le sujet se trouve en situation de “pilotage externe” (situation 1, cas 

2 ); 

3. le sujet se trouve en situation de “pilotage interne” à des degrés 
divers 

situations 2 et 3). 


Le problème de la relation entre «réflexion métacognitive» et 
régulation» est complexe. L’élève peut en effet réguler certaines de ses acti¬ 
vités sans qu’intervienne une réflexion métacognitive et à l’inverse disposer de 
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connaissances métacognitives et ne pas les utiliser. Nous avons d’ailleurs con¬ 
sacré un article antérieur à l’examen de ce problème (Wolfs, 1992). 

Nous nous limiterons ici à citer Glaser (1986) : «Le rôle de ces habile¬ 
tés (relatives aux capacités de contrôle, à la métacognition) serait relative¬ 
ment limité dans les démarches intellectuelles s’appliquant à des domaines de 
connaissances spécifiques où le sujet dispose facilement de schèmes ou de 
procédures qui lui permettent de traiter rapidement les données d’un 
problème». Toutefois, il ajoute : «On peut enseigner à des étudiants la con¬ 
naissance d’une règle, d’une théorie ou d’une procédure, mais si on prend 
pour critère le transfert des apprentissages à de nouvelles situations, il faut en 
outre que ces étudiants sachent contrôler eux-mêmes l’utilisation de leurs 
connaissances. » 

Ce rôle de la métacognition comme agent facilitateur du transfert 
d’apprentissage a été particulièrement mis en évidence par Sternberg et Wa¬ 
gner (1984), Derry, & Murphy (1986) au terme d’une large revue de la littéra¬ 
ture portant sur l’étude des facteurs exerçant une influence sur l’efficacité (le 
transfert) des programmes visant le développement des «thinking skills» et 
«learning skills». 


3. ANALYSE DES DIFFÉRENTES PRATIQUES ÉDUCATIVES 
visant à aider les élèves à piloter, auto-évaluer 
et réguler leurs propres apprentissages 

Nous nous centrerons essentiellement sur les pratiques qui utilisent 
comme support des questionnaires ou des grilles visant - au sens large - à sus¬ 
citer chez l’élève une réflexion sur ses apprentissages (passés, présents ou fu¬ 
turs) et/ou un pilotage et une régulation de ceux-ci. Nous proposons ci-après 
une grille d’analyse de ces pratiques éducatives visant à identifier : 

- le (ou les) objectif(s) pédagogique(s) de l’outil proposé aux élèves 
(critère 1); 

- les facettes du fonctionnement cognitif et/ou métacognitif concernées 
par le questionnaire ou la grille proposée aux élèves (critère 2), 

- le mode de communication utilisé dans le questionnaire ou la grille 
(critère 3), 

- la qualité des activités métacognitives (critère 4). 


Critère 1 : objectif (s) pédagogiques de l’outil proposé aux élèves 

(1) Mieux s’approprier un savoir ou un savoir-faire OUI / NON 
cognitifs bien spécifiques. 

(ex : le calcul de la surface du parallélogramme) 
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(2) Acquérir ou développer une compétence OUI / NON 

cognitive globale et transférable 

(ex : la synthèse, la prise de notes, 
la compréhension de textes...] 

(3) Développer des comportements socio-affectifs OUI / NON 
présumés favorables à l’activité cognitive. 

(4) Développer l’une ou l’autre composante OUI / NON 

de la métacognition 

(ex : l’auto-évaluation) 

(5) Apprendre globalement à piloter et à gérer OUI / NON 

ses apprentissages : anticiper, analyser, 

auto-évaluer, réguler... 

(ex : démarche d’apprentissage d’une leçon, 
gestion d’une session d’examen...) 


Critère 2 : facettes du fonctionnement cognitif et/ou métacognitif 
concernées par la grille ou le questionnaire proposés aux élèves 

Un même outil pédagogique proposé aux élèves (questionnaire, 
grille...) est susceptible de couvrir une gamme plus ou moins large 
d’activités cognitives et/ou métacognitives. C’est pourquoi, il est indis¬ 
pensable d’analyser chacun de ses items en particulier afin de tenter 
de déterminer les facettes du fonctionnement cognitif et/ou métaco¬ 
gnitif auxquelles ces items font appel. Nous recommandons concrète¬ 
ment d’attribuer un numéro à chacun des items de l’outil pédagogique 
analysé et ensuite de reporter ces numéros en face de chacune des 
sous-rubriques du critère 2. En outre, lors de l’analyse d’un outil pé¬ 
dagogique, il convient chaque fois de se demander si la réponse four¬ 
nie par l’élève est : 

non induite (N.I.), 

induite par la question posée (I.Q.), 

induite par les différentes possibilités de réponse qui lui sont propo¬ 
sées (I.R.). 

Exemples : « Comment as-tu étudié ta leçon de mathématiques ? » est 
une question non induite. Par contre la question «Décris le plus pré¬ 
cisément possible comment tu as étudié ta leçon de mathé¬ 
matiques ? » est supposée induire une activité d’explicitation de la 
part du sujet, alors que la question «Compare la manière dont tu as 
étudié ta leçon de mathématique et celle de français » devrait induire 
une activité d’analyse (comparaison) chez l’élève. 
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Modalités d’application du critère 2 : 

Indiquer les numéros attribués à chacun des items de l’outil pé¬ 
dagogique analysé de la (ou des) rubrique(s) correspondantes(s). 



N.l. : I.Q. : l.R. 

(1) Items portant sur des activités cognitives 


- savoir, savoir-faire spécifiques : - produits 


- processus 


- compétences globales: - produits 


- processus 


(2) Items portant sur des activités métacognitives : 


■ Explicitation : 


- Mode descriptif : - fonctionnement personnel 


- variables externes 


- Mode évaluatif : - fonctionnement personnel 

i i 

i i 

- variables externes 

i i 

i i 

- Analyse : 


- Mode descriptif : - fonctionnement personnel 

i i 

i i 

i i 

- variables externes 

i i 

i i 

i i 

- Mode évaluatif : - fonctionnement personnel 

i i 

- variables externes 

i i 

- Régulation(s) : 


(3) Divers (Items de l'outil pédagogique analysé ne portant pas 


spécifiquement sur une activité cognitive ou métacognitive.) 


(4) Autres renseignements : 


■ Les items relatifs à l'explicitation sont : 


- contextualisés (référence précise 

• ■ 

à une situation d'apprentissage), 


- décontextualisés. 

! 

' 1 

- Les items relatifs à l'explicitation portent sur des situations : 

1 1 

1 1 

- passées 


- présentes 

1 1 

1 1 

- futures (anticipation) 

1 1 

1 i 

1 1 

- Les items relatifs à l'analyse portent sur des situations 


- passées 


- présentes 


- futures (anticipation) 

1 1 

1 1 


Ce critère permet d’identifier et de clarifier les habiletés métacogniti- 
ves que l’élève est supposé maîtriser pour utiliser correctement cer- 
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tains outils d’(auto)-évaluation diagnostique qui lui sont proposés. 
Ces habiletés varient en effet largement en fonction du niveau d’ap¬ 
profondissement attendu du diagnostic : simple description ou analy¬ 
se de la démarche utilisée, mise en évidence ou non de facteurs plus 
généraux communs à de multiples tâches, indication ou non de remé¬ 
diations etc... 


Critère 3 : mode de communication utilisé dans le questionnaire 
ou la grille 

Mode descriptif, analytique 

OUI/NON 

Mode évaluatif 

OUI/NON 

Mode prescriptif 

OUI / NON 

Recoins au questionnement 

OUI / NON 

Questions ou critères : - fermés 

OUI/NON 

- semi-ouverts 

OUI / NON 

- ouverts 

OUI / NON 


Critère 4 : qualité des activités métacognitives 

La grille ou le questionnaire proposé à l’élève lui permet-il de caracté¬ 
riser la qualité de ses activités métacognitives ? Voici, à titre indicatif, 
quelques exemples d’indicateurs de qualité des activités 
métacognitives : 


Pour l’EXPLICITATION : 

- le degré d’exactitude OUI / NON 

- le degré de précision OUI / NON 


Pour l’ANALYSE : 

- le nombre d’éléments de son fonctionnement OUI / NON 

cognitif mis en relation (dans une situation donnée), 

- le degré d’élaboration des relations rapportées OUI / NON 
(ex : simples relations temporelles, ou relations 
but/moyen, condition/effet...) 

- la validité des explications rapportées OUI / NON 


Pour la CONCEPTUALISATION : 

- pouvoir décontextualiser une stratégie OUI / NON 

- pouvoir préciser le domaine d’application OUI / NON 

d’une stratégie (ne pas lui donner une extension 

trop faible ou trop grande). 
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• Pour l’AUTO-EVALUATION : 

- degré de réalisme (fonder son jugement OUI / NON 

sur une analyse de la réalité, choisir des indicateurs 
pertinents, des procédures de vérification, 

éviter une tendance systématique à la sous 
ou sur-estimation...) 

- équilibre dans la recherche d’explications OUI / NON 

de la réussite ou de l’échec entre les facteurs 

internes et externes. 

Dans les faits, ce critère est particulièrement difficile à opérationnali¬ 
ser. 


4. EN GUISE DE CONCLUSION PROVISOIRE 

Notre objectif dans cet article a été d’essayer d’articuler les pratiques 
éducatives qui visent au sens large à aider les élèves à devenir plus autonomes 
(à «piloter» et à évaluer leurs apprentissages) aux travaux de recherche por¬ 
tant sur la métacognition. Pour ce faire, nous avons tenté dans un premier 
temps de clarifier le concept de métacognition et d’en proposer un modèle 
synthétique adapté aux situations éducatives. Celui-ci nous a permis, dans un 
second temps, d’élaborer un outil d’analyse de ces pratiques éducatives qui 
soit cohérent par rapport au modèle proposé. Nous espérons ainsi aider les en¬ 
seignants à réfléchir aux différents types d’activités métacognitives qu’ils ten¬ 
tent de susciter chez les élèves lorsqu’il utilisent ces outils pédagogiques. 

Toutefois, nous sommes bien conscient que notre instrument d’analy¬ 
se de ces pratiques éducatives n’est à ce jour qu’une première ébauche, qu’il 
conviendrait d’enrichir (en le confrontant à des pratiques éducatives contras¬ 
tées) et d’opérationaliser davantage. En particulier, dans la suite de nos tra¬ 
vaux, nous devrons davantage prendre en compte : 

- le contexte pédagogique global dans lequel s’inscrit l’utilisation de 
l’outil pédagogique utilisé (degré d’appropriation par l’élève ? 
transfert ?...); 

- les facteurs affectifs ou conatifs pouvant interagir avec les aspects co¬ 
gnitifs ou métacognitifs examinés : sentiment d’efficacité personnelle, 
self-esteem, facteurs attributionnels de la réussite ou de l’échec... Les 
travaux de Scallon (1992) ouvrent des pistes intéressantes à cet 
égard. 
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1. LE PROBLÈME DE LA STABILITÉ 
EN THÉORIE OPÉRATOIRE 

La psychologie du développement de l’intelligence de Jean Piaget a 
principalement contribué à faire ressortir les caractéristiques invariantes de 
l’intelligence. Inhelder et Piaget (1955) ont bien démontré que malgré la di¬ 
versité des expériences cognitives individuelles, la structuration des opéra¬ 
tions formelles en une organisation adaptée procède par des mécanismes et 
aboutit à des schèmes qui sont les mêmes pour tous les individus. 

À l’opposé de la psychologie génétique, la psychologie différentielle 
insiste davantage sur les facteurs de l’intelligence qui font qu’un individu peut 
manifester un meilleur fonctionnement dans certaines activités que dans 
d’autres. La psychologie différentielle tient compte du fait que la capacité à 
structurer un problème peut être affectée par des facteurs d’habiletés cogni¬ 
tives tels que la tâche et le contenu. 

En théorie opératoire, il est tout aussi nécessaire de s’intéresser, tout 
comme en psychologie différentielle, aux conditions qui affectent la stabilité 
de la performance. Des mesures stables sont nécessaires pour plusieurs 
raisons : 

1. d’abord, pour expliquer des écarts de performance qui ne peuvent 
être imputés à des différences au niveau de la structuration des opé¬ 
rations; 

2. ensuite, pour rendre plus pratique et plus réaliste l’utilisation de la 
théorie opératoire en psychologie et en éducation. 

Comment en effet expliquer les différences (p.e. entre individus qui 
semblent pourtant parvenus aux mêmes paliers de développement) si l’on 
ignore l’intervalle de confiance à l’intérieur duquel on peut raisonnablement 
situer les mesures développementales ? 

L’étude de la stabilité de la performance est donc d’une grande impor¬ 
tance pour expliquer les aspects à la fois réguliers (dans sa structuration) et 
irréguliers (dans son fonctionnement) du développement. Piaget a porté une 
attention particulière à l’étude des processus structuraux mais l’aspect fonc¬ 
tionnel, laissé en friche, soulève encore de nombreux problèmes dans l’étude 
du développement. Voici quelques exemples de ces problèmes : 

1. Le problème des décalages horizontaux : comment se fait-il qu’une 
opération développée dans un domaine de la connaissance se généra¬ 
lise plus ou moins facilement à d’autres domaines ? 

2. Le problème de la familiarité avec le contenu : comment l’expé¬ 
rience accumulée dans un domaine facilite-t-elle ou accélère-t-elle le 
développement dans ce domaine ? 

3. Le problème de l’hétérogénéité du développement chez un même 
individu : comment expliquer qu’un individu ne soit pas parvenu au 
même niveau opératoire dans différents domaines et jusqu’à quels 
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«écarts de développement» doit-on s’attendre chez le même 
individu ? 

Les principaux efforts de recherche effectués jusqu’à présent n’ont 
réussi qu’à décrire les phénomènes. Les tentatives d’explication sont demeu¬ 
rées incertaines pour plusieurs raisons : 

- l’absence de devis expérimentaux pouvant contrôler simultanément 
plusieurs variables affectant la performance; 

- le manque de concordance dans la mesure du développement que ce 
soit au niveau des épreuves employées ou des critères de cotation des 
résultats; 

- le caractère pas toujours approprié de la méthode clinique dans l’étu¬ 
de de la stabilité de la performance. 

1.1 Le rôle de la fiabilité en développement 

Malgré les difficultés que peuvent occasionner l’instabilité des perfor¬ 
mances mesurées avec des instruments opératoires, peu d’efforts ont été dé¬ 
ployés pour mesurer la fiabilité de ces mesures et des procédures de cotation. 
Or, avant même de pouvoir discuter de l’hétérogénéité des performances d’un 
individu ou de l’effet de certaines variables sur sa performance, il faut pouvoir 
démontrer que les procédures et instruments que nous employons permet¬ 
tent de recueillir une information fidèle. En effet, plusieurs recherches en dé¬ 
veloppement ne fournissent aucune des informations suivantes : 

- Le degré de concordance des évaluateurs : dans une situation d’in¬ 
terrogation clinique, dans quelle mesure des administrateurs diffé¬ 
rents parviennent-ils aux mêmes résultats avec le même individu dans 
des conditions parallèles (Nyiti, 1982) ? 

- Le degré de stabilité temporelle d’une performance : dans une si¬ 
tuation de mesure répétée dans des laps de temps très courts, quelle 
est la stabilité de la performance observée ? 

- Le degré d’équivalence des situations-problèmes : dans quelle me¬ 
sure des problèmes jugés formellement «équivalents» le sont-ils vrai¬ 
ment en situation de mesure répétée ? 

Il serait donc important que l’utilisation des épreuves piagétiennes 
s’accompagne de renseignements permettant d’apprécier la fiabilité des résul¬ 
tats. Ces renseignements devraient inclure : 

- Le coefficient de cohérence interne (alpha de Cronbach) pour les 
épreuves collectives ou encore un coefficient de concordance inter-ju¬ 
ges pour des interrogations cliniques individuelles. Cette information 
est nécessaire pour déterminer si items ou juges mesurent tous la 
même habileté opératoire, et ce, de la même façon. 

- Le coefficient de stabilité, calculé par la méthode test-retest, pour les 
études longitudinales. Cette information est essentielle pour départa- 
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ger le manque de stabilité liée à l’erreur de mesure au test du manque 
de stabilité liée au développement. 

- Le coefficient d’équivalence, calculé par la corrélation entre épreu¬ 
ves parallèles : cette information est essentielle pour départager hété¬ 
rogénéité due à la performance du sujet et hétérogénéité dans 
l’échantillonnage des items, exercices ou situations-problèmes. 

- Le coefficient de stabilité-équivalence, calculé par la corrélation en¬ 
tre deux épreuves parallèles administrées à des moments différents : 
cette information est essentielle pour départager dans la variance des 
résultats, celle qui est due au développement de celle qui est imputa¬ 
ble à la fois à la répétition de la mesure et à l’échantillonnage des 
items. 

On peut se demander si cette tentative d’appliquer les indices les plus 
courants de fiabilité à l’étude du développement ne revient pas à 
«psychométriser» Piaget pour la deuxième fois. En effet, Tuddenham (1971) 
parlait pour la première fois de «psychométriser» Piaget en suggérant l’em¬ 
ploi d’épreuves collectives (plutôt qu’individuelles) et le recours à des procé¬ 
dures standardisées (plutôt que cliniques) d’administration des épreuves 
opératoires. Tout ceci peut sembler un luxe de procédures, étant donné que 
la théorie du développement a fort bien su progresser en dépit de ces précau¬ 
tions méthodologiques, et que de fait, plusieurs chercheurs n’y ont guère prê¬ 
té attention. 

Si l’étude du développement doit se restreindre aux grandes périodes 
marquant les principaux changements marquant l’évolution des opérations de 
la pensée, alors il y a lieu de croire que l’ensemble des mesures précédentes 
n’est guère nécessaire. Par contre, si à l’intérieur de ces grandes périodes, l’on 
souhaite discriminer plus finement l’influence de facteurs fonctionnels d’ac¬ 
tualisation de ces opérations, alors il est primordial de réduire l’erreur de me¬ 
sure. Cette condition est nécessaire dès qu’il est question chez un même 
individu de discerner son habileté, non plus dans un seul domaine, mais dans 
plusieurs domaines à la fois, ou encore de différencier, entre individus appar¬ 
tenant à une même période, les facteurs qui facilitent ou entravent le dévelop¬ 
pement. Dans toutes ces situations, l’instrument de mesure doit être fiable, 
puisqu’une erreur de mesure trop grande risque de voiler des différences réel¬ 
les entre individus ou encore de masquer, chez un même individu, des diffé¬ 
rences importantes de réussites dans des domaines différents. 

Le développement opératoire et la maturation constituent des effets 
expérimentaux forts comparativement à des effets plus faibles tels que ceux 
rapportés dans la littérature et reliés aux effets dûs à la tâche (Linn et Levine, 
1976), au contenu (Karplus et Peterson, 1970; Lawson, 1974) et au degré de 
familiarité du sujet avec le domaine. Ces effets sont plus facilement voilés lors¬ 
que, utilisant des instruments et des procédures moins rigoureuses, le cher¬ 
cheur confond les différences individuelles avec l’erreur de mesure aléatoire. 
Toutefois, ces effets fonctionnels sont particulièrement importants en ensei- 
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gnement où c’est davantage de micro-développement dont il est question et 
où l’enseignant ne peut attendre le bon vouloir des processus d’équilibration 
et de maturation pour faire progresser l’élève. La connaissance de ces effets 
faibles et du rôle qu’ils jouent dans la consolidation du développement et l’ac¬ 
tualisation des opérations dans différents domaines est donc un objet d’étude 
valable en lui-même. 

1.2 Rôle d'une mesure critériée dans l'étude de la stabilité 

L’étude du fonctionnement intellectuel requiert non seulement une 
plus grande rigueur dans l’utilisation des instruments de mesure et des procé¬ 
dures d’évaluation du développement opératoire, mais aussi un plus grand 
contrôle sur les variables susceptibles d’influencer la performance des sujets. 
Ceci signifie que l’élaboration et la construction de tests devront porter une 
attention particulière à la spécification du domaine des items ou des situa¬ 
tions-problèmes. Le chercheur en développement cognitif aura donc avantage 
à utiliser l’une des nombreuses techniques de spécification de domaine à sa 
disposition en mesure critériée (Roid et Haladyna, 1982). 

Les épreuves de type piagétien, individuelles ou collectives, contrô¬ 
lent un nombre limité de facteurs affectant la situation dans laquelle est réali¬ 
sée la performance. C’est pourquoi la plupart de ces instruments sont 
unidimensionnels : c’est-à-dire qu’ils portent sur des items de mêmes univers 
de contenu et de tâche. Seul le niveau opératoire des items est varié afin d’ob¬ 
tenir une échelle hiérarchique parfaitement reproductible au sens défini par 
Guttman (1944). Il est alors possible de situer le sujet à l’intérieur d’une hié¬ 
rarchie développementale qui ne possède cependant qu’une généralisabilité 
restreinte à d’autres univers de tâches et de contenus. 

En comparant le positionnement respectif de plusieurs individus sur 
un grand nombre d’échelles unidimensionnelles, plusieurs chercheurs ont ob¬ 
servé une certaine hétérogénéité des niveaux de performance aux différentes 
échelles (Stone et Ausubel, 1969; Arlin, 1975; Karplus et al, 1977; Roberge, 
1976, Neimark, 1975; Martorano, 1975; Berzonski, 1971). Les épreuves 
n’ayant pas contrôlé les conditions de réalisation de la performance et l’inter¬ 
valle de confiance des mesures n’étant pas précisé, il est alors très difficile 
d’expliquer de façon univoque ces écarts entre résultats à des épreuves unidi¬ 
mensionnelles. 

Scallon (1981, 1982) propose un modèle d’évaluation diagnostique 
fondé sur l’étude des composantes de la variance d’un test construit selon des 
facettes. Ce modèle permet d’identifier les facettes d’un problème ou d’une si¬ 
tuation d’apprentissage qui exercent un effet significatif. Il permet de consi¬ 
dérer également certains effets d’interaction. Par exemple, une interaction 
entre les sujets et les différences obtenues parmi les éléments d’une facette 
permettent d’inférer qu’une facette ne crée pas les mêmes difficultés chez 
tous les individus. 
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Gray (1978) propose d’utiliser conjointement mesure critériée et 
théorie opératoire. Selon Gray, la théorie de Piaget et la mesure critériée se 
complètent parce que : «piagetian theory emphasizes the reasoning deman- 
ded by an item rather than its content alone». Les épreuves développementa¬ 
les de Piaget permettent de déterminer le type d’opérations employées dans 
la résolution d’un problème. Pour sa part, la mesure critériée contribue à spé¬ 
cifier le contenu du domaine ou les différentes tâches pour lesquelles ces opé¬ 
rations peuvent être réalisées avec succès. La spécification de domaine des 
items permet de construire des instruments de mesure opératoire qui contrô¬ 
lent mieux les facteurs affectant la performance. Le contrôle de ces facteurs 
est indispensable à une étude scientifique du fonctionnement intellectuel. 

Lautrey, Ribeaupierre et Rieben (1981) ont fait l’hypothèse que la va¬ 
riabilité du niveau opératoire d’un même individu en fonction des situations 
peut renseigner sur des aspects du fonctionnement cognitif que la théorie 
opératoire ne prend pas en ligne de compte. Toutefois, toutes les manifesta¬ 
tions de la variabilité intra-individuelle du niveau opératoire n’ont pas selon 
eux le même intérêt : elles doivent être suffisamment marquées et stables 
pour donner lieu à des faits répétables. 

L’étude de la variabilité intra-individuelle des réussites passe, selon 
Lautrey et al. (1981) et selon Londeix (1985), par la réintégration dans la 
théorie opératoire des aspects négligés de la psychologie différentielle de l’in¬ 
telligence. En effet, la description des isomorphismes de structure des tâches 
ne suffit pas à expliquer les variabilités intra-individuelles de performance. 
Londeix (1985) considère pour sa part que c’est au niveau du choix des situa¬ 
tions et du contexte dans lequel les sujets sont placés, ainsi que dans la ma¬ 
nière dont leurs réponses sont traitées et cotées que peut s’effectuer le mieux 
cette interconnection entre psychologie opératoire et psychologie différen¬ 
tielle. 

2. VERS UN MODÈLE HEURISTIQUE 
DE MESURE DE LA STABILITÉ 

2.1 Difficultés soulevées par la théorie classique 

L’applicaton de la mesure critériée à l’étude du développement pose 
le problème de l’estimation de la stabilité de la performance, d’un ou plusieurs 
individus, dans plusieurs contextes de tâches, de contenus et de niveaux opé¬ 
ratoires d’organisation. Selon Popham et Husek (1979), les indices de fiabilité 
fondés sur la cohérence interne ne sont d’aucune utilité à la mesure critériée. 
Ils prétendent que puisque la mesure critériée a pour but de déterminer le 
rendement d’un individu par rapport à un critère, la signification du score de 
l’individu ne devrait pas dépendre des scores d’autres individus. Ils en con¬ 
cluent que la variabilité des scores n’est pas une condition nécessaire à la créa¬ 
tion d’un bon test critérié. 
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Les indices classiques de cohérence interne, stabilité, équivalence et 
de stabilité-équivalence ne permettent pas non plus d’aborder la question de 
la stabilité de la performance lorsque plus d’une variable indépendante est en 
jeu. Chaque effet est évalué séparemment sans possibilité d’étudier les inte¬ 
ractions entre variables. Pris individuellement, ces indices nous renseignent 
sur l’erreur de mesure liée à la répétition dans le temps (coefficient de stabi¬ 
lité), à l’échantillonnage des items (coefficient d’équivalence) ou à l’homogé¬ 
néité des items (cohérence interne). Cependant, ils ne permettent pas de 
tenir compte simultanément des conditions affectant la stabilité de la perfor¬ 
mance ni même de leurs interactions possibles. 

L’utilisation d’indices multiples de fiabilité ne permet pas d’apporter 
de solutions valables à un problème relativement simple et fort susceptible de 
se produire en recherche. Il est donc essentiel de pouvoir situer les sources de 
variation dans un cadre unique pour apprécier simultanément l’importance de 
plusieurs facettes d’un instrument de mesure ainsi que leurs interactions. 

2.2 La théorie de la généralisabilité 

Cronbach, Rajaratnam et Gleser (1963) ont élaboré la théorie de la gé¬ 
néralisabilité dans le but de réunir en un seul concept les différentes défini¬ 
tions de la fiabilité. En utilisant les principes de l’analyse de variance, 
Cronbach et al. proposent de quantifier l’importance de chaque source de va¬ 
riation d’une situation de mesure. Le score vrai est l’espérance mathématique 
de toutes les observations possibles et l’erreur est le résultat d’une fluctuation 
dans l’échantillonnage de certains niveaux de facettes considérés (évalua¬ 
teurs, moments, formes d’items, etc.). 

La généralisabilité est donc un concept plus englobant que celui de 
fiabilité. Il permet également de décrire des situations de mesure plus comple¬ 
xes et plus près de la réalité. Cardinet et Tourneur (1985) la définissent ainsi : 
«La généralisabilité est donc le degré auquel on peut généraliser un résultat 
obtenu dans des conditions particulières à la valeur théorique recherchée». 

Il existe donc autant de coefficients de généralisabilité qu’il existe de 
plans d’observation (ou plans d’expérience). Néanmoins, ceux-ci ne sont pas 
tous d’un égal intérêt. Selon l’univers de généralisation choisi, l’estimation 
sera plus précise selon que cet univers est étroit ou étendu. Cependant, il y a 
peu d’utilité à généraliser une information à un univers restreint de condi¬ 
tions. 


En se fondant sur le principe de la symétrie des données dans un plan 
d’analyse de variance, Cardinet et Tourneur (1985) ont étendu la théorie de 
la généralisabilité initiale (Cronbach, Gleser, Nanda et Rajarathnam, 1972). 
En effet, pour Cronbach et al. la facette «sujets» constitue la seule facette de 
différenciation utile. Or, en psychologie et en éducation, le chercheur n’est 
pas seulement intéressé à estimer la stabilité des scores des sujets, il peut être 
intéressé par d’autres facettes de différenciation tels que les items. Il peut 



196 Implications psychométriques 


s’agir d’estimer la stabilité des effets des différentes tâches et des différents 
contenus des items introduits dans le plan d’observation. Dans dé telles con¬ 
ditions, ce ne sont plus les sujets que l’analyse de généralisabilité cherchera à 
différencier, mais bien les tâches et les contenus en tant qu’objets d’observa¬ 
tion. L’échantillonnage des personnes est alors considéré comme erreur de 
mesure. 


La démarche proposée par Cardinet et Tourneur (1985) permet donc 
de définir une série de procédures de calcul applicables à tous les types de 
plans expérimentaux et qui permettent de tenir compte du «projet de 
mesure». En effet, selon ces deux auteurs : 

L’erreur n’apparaît que par rapport à un projet de mesure. Elle suppose 
une intention particulière qui privilégie une ou plusieurs facettes com¬ 
me conditions d’observation, c’est-à-dire comme sources d’erreurs... C’est 
(...) après le choix d’une direction privilégiée de mesure, que s’insère la 
théorie de la généralisabilité. Son rôle est de préciser l’importance de la 
variance due aux facettes privilégiées (variance de différenciation) par 
rapport à la variance due à l’échantillonnage des conditions d’observa¬ 
tion (variance d’erreur). (p.31) 

La démarche proposée par Cardinet et Tourneur (1985) s’effectue en 
quatre phases : les phases 1 et 2 se rapportent à l’analyse de variance; les pha¬ 
ses 3 et 4 se rapportent à l’étude de généralisabilité proprement dite. Voici une 
courte description de ces quatre phases : 

1. Plan d’observation : au cours de cette phase, on procède au choix 
des facettes et au nombre de niveaux de chaque facette. On précise 
également les interrelations (nichage, croisement) entre ces facettes. 

2. Plan d’estimation : au cours de cette phase, on détermine quelles 
facettes représentent un échantillonnage aléatoire ou exhaustif (effet 
fixe) de niveaux. 

3. Plan de mesure : au cours de cette phase, on identifie quelles facet¬ 
tes sont liées au projet de mesure (facettes de différenciation) et 
quelles facettes seront considérées comme sources d’erreur de 
mesure (facettes d’instrumentation). C’est au cours de cette phase 
que les composantes de variance calculées à la phase deux peuvent 
être attribuées à la variance vraie ou à la variance d’erreur, permet¬ 
tant ainsi le calcul du coefficient de généralisabilité. 

4. Plan d’optimisation : cette phase consiste à modifier soit le plan 
d’observation, soit le plan d’estimation, soit le plan de mesure ou 
encore une combinaison des trois afin de maximiser la généralisabi¬ 
lité des observations. Le chercheur devra trouver alors un équilibre 
entre précision de la mesure et étendue de l’univers de généralisa¬ 
tion. En effet, plus l’univers de généralisation est grand, plus il est 
difficile d’obtenir des mesures peu entachées d’erreur. Par contre, il y 
a peu d’intérêt pratique à utiliser des mesures précises lorsque l’uni¬ 
vers de généralisation est trop étroit. 
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L’étude de la généralisabilité est utile à un autre point de vue. Elle per¬ 
met de tenir compte du type d’erreur de mesure dans le calcul du coefficient 
de fiabilité. Cardinet et Tourneur (1985) établissent une distinction entre er¬ 
reur de mesure absolue et erreur de mesure relative. Cette distinction est pri¬ 
mordiale en psychologie du développement ainsi que dans tout système de 
mesure psychologique où des seuils critiques sont utilisés pour déterminer si 
un stade ou une étape de développement a été atteint ou pas. Dans de tels cas, 
il est nécessaire de calculer la fiabilité par rapport à l’erreur absolue de mesure 
et non pas par rapport à l’erreur relative. 

En psychologie différentielle, c’est l’erreur sur les positions relatives 
des résultats qui est la plus pertinente. En psychologie du développement, il 
n’est pas utile de déterminer si un instrument permet de mieux distinguer si 
un individu est plus avancé dans son développement qu’un autre individu, car 
ce genre de tests n’est pas utilisé à des fins de classement ou de sélection com¬ 
me c’est le cas par exemple de tests d’intelligence de type Q.I. Dans le contex¬ 
te développemental, c’est davantage l’erreur sur la valeur obtenue par rapport 
à une échelle dont les échelons sont définis a priori qui doit intéresser le cher¬ 
cheur. Afin de déterminer si la performance d’un individu a dépassé une va¬ 
leur critique permettant d’affirmer qu’un nouveau stade ou étape de 
développement a été atteint, le chercheur a besoin d’une estimation du degré 
de réussite à l’intérieur d’un intervalle de confiance le plus restreinte possible. 

2.3 Objectifs 

Afin d’illustrer comment il est possible d’appliquer la théorie de la gé¬ 
néralisabilité au calcul de la fiabilité dans une variété de conditions, nous 
avons choisi un test construit au moyen de facettes. Nous démontrerons com¬ 
ment l’étude des composantes de variance et l’optimisation des différentes 
mesures permettent d’approfondir le diagnostique des difficultés. 

Les objectifs de cette étude sont les suivants : 

1. Illustrer comment l’évaluation diagnostique peut tirer profit de 
l’étude des différentes composantes de variance des résultats au test, 
pour mieux faire porter l’intervention et la remédiation sur les fac¬ 
teurs les plus utiles. 

2. À partir du principe de symétrie des données de l’analyse de 
variance, étudier la fiabilité d’un instrument selon différents projets 
de mesure. Dans certaines situations, il faut considérer l’erreur de 
mesure sur les facettes d’intérêt (spécification du domaine des 
items) plutôt que sur les sujets. Les résultats de l’étude de générali¬ 
sabilité seront donc présentés quant à plusieurs plans de mesure. 

3. Faire ressortir l’importance d’utiliser l’erreur de mesure absolue dans 
l’étude du développement. Un instrument peut être adéquat à des 
fins de classement, mais avoir peu de fiabilité lorsqu’il s’agit de déter¬ 
miner un seuil de réussite. C’est pourquoi des coefficients de généra- 
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lisabilité d’erreur relative et d’erreur absolue seront calculés pour 
différents plans de mesure. 

4. Comparer l’efficacité de différents plans d’optimisation. Il s’agira de 
démontrer comment l’étude de généralisabilité permet au chercheur 
de mieux optimiser sa mesure en sachant quels types d’items et 
quelle quantité d’items additionnels permettent d’accroître la fiabilité 
du test en entier. 

3. MÉTHODOLOGIE 

3.1 Sujets 

Quarante-huit sujets adultes, des niveaux primaire (8), secondaire 
(27) et collégial (13) ont répondu au test Imageo5D sur une base volontaire. 
Ces adultes, 31 femmes et 17 hommes étaient âgés entre 19 et 55 ans, la 
moyenne d’âge étant de 29,5 ans (s = 6,96). 

3.2 Instrument 

L’instrument Imageo5D (Laveault, 1987) est un instrument critérié de 
mesure de l’habileté à représenter mentalement différents arrangements de 
figures géométriques dans un espace plan. À partir d’un ensemble de 5 ou de 
7 figures géométriques dont une partie ou la totalité sont voilées, le sujet doit 
reconstituer les figures individuelles afin de déterminer quels ensembles sont 
ou ne sont pas constitués des mêmes figures. 

La tâche de ce test consiste à trouver deux ensembles constitués des 
mêmes figures de base. Ces figures de base sont celles du casse-tête chinois 
«Tangram» : 2 petits triangles, 1 triangle moyen, 1 parallélogramme, 1 carré 
pour l’ensemble de 5 figures et 2 grands triangles en plus, pour l’ensemble de 
7 figures. Ces figures peuvent être combinées de plusieurs façons pour repro¬ 
duire une infinité de formes différentes. Le test introduit la difficulté 
suivante : l’aire de chaque figure est proportionnelle à l’aire de chacune des 
autres figures et chaque figure plus grande peut être reconstruite à partir 
d’une combinaison de figures plus petites. C’est ainsi que deux petits triangles 
peuvent être combinés pour former un carré, un parallélogramme et un trian¬ 
gle moyen, etc. 

Sur le plan opératoire, ce test nécessite des habiletés de représenta¬ 
tion spatiale dans l’espace plan ainsi que l’opération d’arrangement. Chaque 
figure plus grande peut-être décomposée pour constituer des figures plus pe¬ 
tites et réciproquement, deux figures plus petites ou plus peuvent reconsti¬ 
tuer une figure plus grande. Le sujet doit déterminer, à partir de l’ensemble 
des figures en présence (non voilées) quels arrangements de ces figures sont 
possibles dans un plan. 
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Ce test requiert les opérations concrètes lorsqu’il s’agit d’effectuer des 
arrangements d’un petit nombre de figures. Par contre, les opérations formel¬ 
les deviennent nécessaires, lorsqu’en présence d’un grand nombre de figures 
voilées, le sujet doit envisager un ensemble d’arrangements possibles et élimi¬ 
ner ceux qui ne peuvent être construits à partir de l’ensemble des figures géo¬ 
métriques de base (cinq ou sept). 

Ce test permet de contrôler trois facettes de résolution de problèmes. 
Ces facettes forment un plan d’observation totalement croisé et sont décrites 
dans la figure 1. Ces trois facettes sont les suivantes : 

• Contours : 

1. détaillés; 

2. non détaillés. 

• Nombre de figures : 

1. sept; 

2. cinq. 

• Nombre d’indices : 

1. trois figures indices; 

2. deux figures indices; 

3. aucune figure indice. 


lmageo5D 

Exercices avec 7 figures 

Exercices avec 5 figures 


2 

figures/indices 

0 

figures/indices 

3 

figures/indices 

2 

figures/indices 

0 

figures/indices 

Fgures à contours 

détaillés 







Fgures à contours 

non détaillés 








Figure 1 

Spécification du domaine du test ImageoSD (Laveault, 1987) 


Ces facettes permettent de générer 12 catégories d’items différents, 
chacune répondant à des conditions de réussite à la fois semblables et à la fois 
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différentes de celles des autres items. Étant donné qu’il s’agit d’un plan par¬ 
faitement croisé, il est également possible d’envisager l’étude d’interactions 
entre les trois facettes et leurs différents niveaux. Un exemple d’item corres¬ 
pondant à la catégorie «contours détaillés» x «sept figures» x «deux figures 
indices» est illustré à la figure 2. 



Figure 2 

Exemple d'item du test lmageo5D (Laveault, 1987) 


3.3 Procédure 

Le test Imageo5D a été administré dans le cadre d’une recherche plus 
vaste sur l’évaluation formative des habiletés intellectuelles de l’adulte. Ce 
test a été le premier d’une série à être administré aux sujets. 

Il a été administré durant les périodes de cours à l’institution scolaire 
fréquentée par le sujet. Chaque sujet recevait 4 $ pour chaque heure de par¬ 
ticipation à la recherche. 







Mesure critériée et théorie de la généralisabilité : applications aux mesures cognitives 201 


4. RÉSULTATS 

4.1 La théorie de la généralisabilité 

L’étude de la généralisabilité des résultats du test Imageo5D se fera 
selon les quatre étapes proposées par Cardinet et Tourneur (1985) : plan 
d’observation, plan d’estimation, plan de mesure et finalement, plan d’optimi¬ 
sation. 


4.2 Plan d'observation et plan d'estimation 

Avant d’entreprendre le calcul des composantes de variance et des 
différents coefficients de généralisabilité pour chacun des objets de mesure, il 
est nécessaire de spécifier l’univers de généralisation du plan d’estimation. 
Chaque facette a été estimée de la manière suivante : 

1. la facette «contours» (C) a été considérée comme fixée, puisqu’elle 
épuise toutes les possibilités de niveaux de l’univers de généralisation 
(contours détaillés et non détaillés); 

2. les facettes «nombre de figures» (N), «nombre d’indices» (I) et 
«personnes» (P) ont été considérées comme aléatoires. Notre objec¬ 
tif consiste à généraliser les conclusions à toutes les situations diffé¬ 
rentes de «nombre de figures», «nombre d’indices» et «personnes» 
et non seulement aux conditions rencontrées dans la recherche. Une 
ou plusieurs de ces trois facettes seront considérées à tour de rôle 
comme facette (s) d’instrumentation. 

Étant donné que la facette «contours» est fixée, le plan d’estimation 
de cette recherche est totalement croisé avec des effets mixtes. 

4.3 Composantes de variance et plans de mesure 

Le tableau 1 indique quel pourcentage de la variance totale est expli¬ 
qué par les composantes de variance de chaque facette dans un plan mixte (C 
est fixé, les autres facettes sont aléatoires). On y remarque que les composan¬ 
tes de variance les plus importantes sont d’abord la triple interaction PNI et 
l’interaction PCNI confondue avec l’erreur. Les interactions PI, PNI et PCN 
sont également des effets non négligeables. Les facettes simples les plus im¬ 
portantes sont d’abord les sujets suivies par le nombre de figures indices et le 
nombre de figures totales. La facette C est celle qui possède la plus faible com¬ 
posante de variance. 

Une importante interaction PI indique que la facette des figures indi¬ 
ces n’affecte pas la performance de chaque sujet de la même manière. Les tri¬ 
ples interaction PNI et PCN indiquent que la performance de chaque sujet, 
pour les items de 5 ou 7 figures, est affectée par le nombre de figures indices 
et, dans une moindre mesure, par le détail des contours. L’ensemble de ces in- 
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teractions s’explique facilement : un sujet habile aura la même performance, 
peu importe le nombre de figures totales ou le nombre de figures indices. Il en 
sera de même pour un sujet éprouvant de sérieuses difficultés. Par contre, 
pour un sujet d’habileté «intermédiaire», le nombre de figures indices peut 
n’être d’aucune utilité lorsque le nombre total de figures est restreint (5 figu¬ 
res) mais peut, par contre, devenir fort utile lorsque le problème comporte un 
nombre plus grand de figures. 


Tableau 1 

Composantes de variance du test lmageo5D 1 


; 

Source 
de variation 

Somme 
des carrés 

dl 

Carré 

moyen 

Espérance 
de variance 
modèle mixte 

Composante 
de variance 

P 

38,826 

47 

0,826 

0,0523 

18,77 

C 

1,000 

1 

1,000 

0,0030 

1,07 

PC 

6,667 

47 

0,142 

-0,0012* 

0,00 

N 

4,000 

1 

4,000 

0,0135 

4,83 

PN 

7,333 

47 

0,156 

-0,0013* 

0,00 

CN 

0,174 

1 

0,174 

-0,0029 

0,00 

PCN 

7,493 

47 

0,159 

0,0064 

2,29 

1 

16,253 

2 

8,127 

0,0414 

14,87 

PI 

19,413 

94 

0,207 

0,0107 

3,83 

Cl 

0,198 

2 

0,099 

-0,0045* 

0,00 

PCI 

11,135 

94 

0,118 

-0,0007* 

0,00 

NI 

0,260 

_ 2 J 

0,130 

-0,0004* 

0,00 

PNI 

15,406 

94 

0,164 

0,0819 

29,42 

CNI 

1,941 

2 

0,970 

0,0088 

3,18 

PCNI 

11,392 

94 

0,121 

0,0606 

21,75 


* Les espérances de variance négatives sont ramenées à 0 tel que recommandé par Cardinet et Tourneur (1985), 
page 89. 

L’étude des composantes de variance fournit également des informa¬ 
tions diagnostiques précieuses pour la mise au point d’un plan d’intervention. 
La présence d’une forte composante d’interaction PNI (29,42%) indique que 
l’intervention devra être individualisée. En effet, si l’effet des composantes de 
variance de la facette «nombre de figures indices» (14,87%) indique que le 


1 Calculs effectués au moyen du programme ETUDGEN (Dufour, 1987). 
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fait d’augmenter le nombre de figures indices facilite la tâche pour l’ensemble 
des élèves, la triple interaction PNI révèle qu’elle dépend encore plus de l’élè¬ 
ve en cause et du nombre de figures (5 ou 7) sur lesquelles il travaille. Pour 
un élève éprouvant des difficultés, il faudrait donc considérer quels items 
comportant 5 ou 7 figures sont réussis avant de décider si l’on réduit le nom¬ 
bre de figures indices, le nombre total de figures ou les deux à la fois. La pré¬ 
sence d’une forte interaction PNI tend à indiquer que l’on ne saurait utiliser le 
même plan d’intervention pour faire progresser simultanément tous les sujets. 
Ce qui s’avère une aide pour l’un, risque de ne pas l’être pour l’autre. 

L’étude des composantes de variance associées à la facette 
«contours» révèle que celle-ci n’influence que très peu les résultats des sujets 
de notre échantillon (1,07%). Il y a donc peu d’intérêt à manipuler cette 
variable : augmenter ou diminuer le nombre de contours des figures cachées 
ne semble pas aider les sujets de notre échantillon outre mesure. On peut 
donc l’ignorer dans notre plan d’intervention avec des sujets de ce groupe. 

Enfin, l’ordre de grandeur de la composante «personnes» (18,77%) 
nous indique l’homogénéité du groupe. Une composante élevée indique des 
différences importantes entre les scores des sujets. Une composante faible ré¬ 
vèle que les sujets réalisent des performances semblables pour les questions 
tirées de l’univers de généralisation du test. Dans le cas qui nous intéresse, le 
groupe est relativement hétérogène. Pour évaluer l’efficacité de notre plan 
d’intervention, nous pourrions réexaminer cette composante de variance suite 
à une intervention pédagogique. Une diminution du pourcentage de variance 
associé à cette facette indiquerait que le groupe devient plus homogène et 
donc, que nous avons réussi à réduire les écarts de performance entre ceux 
qui réussissaient bien et ceux qui éprouvaient auparavant des difficultés. 

4.4 Coefficients de généralisabilité 

Le tableau 2 présente un exemple de calcul du coefficient de généra¬ 
lisabilité des scores des sujets pour le plan P/CNI. Si le but recherché est de 
classer les sujets par ordre d’importance de leur score total, comme c’est le 
cas lors de tests normatifs ou de tests de sélection, alors le coefficient de gé¬ 
néralisabilité d’erreur relative est passablement acceptable (0,7520) considé¬ 
rant le petit nombre d’items (12) ayant servi à la mesure. Par contre, si l’on 
devait effectuer, dans le contexte d’une mesure critériée, une prédiction 
quant à la proportion des items de l’univers de généralisation que le sujet est 
capable de réussir, alors le coefficient de généralisabilité calculé sur l’erreur 
absolue de mesure est beaucoup moins acceptable (0,5810). Or, dans le cas 
d’une mesure développementale, telle que celle du niveau opératoire, il impor¬ 
te peu de déterminer quel sujet est le plus avancé dans son développement. Il 
importe davantage de déterminer avec quel degré de précision il est possible 
d’estimer si le sujet a dépassé un seuil absolu de réussite correspondant à un 
stade précis de développement. Dans cette situation, il faut tenir compte de 
l’erreur absolue dans le calcul du coefficient de généralisabilité. Avec 12 items, 
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les résultats au test Imageo5D ne peuvent pas être considérés comme suffi¬ 
samment fidèles pour déterminer avec assurance le stade de développement 
auquel est parvenu chaque sujet. 

Si l’on considère que bien des épreuves piagétiennes ne comportent 
guère plus de 12 items, on peut s’interroger sur la possibilité de classer cor¬ 
rectement en stades un individu à partir d’un si petit échantillon d’items. Pour 
cela, il faudrait effectuer des calculs similaires à celui-ci pour des épreuves 
piagétiennes connues afin de vérifier si l’erreur absolue de mesure est du 
même ordre de grandeur avec le même nombre réduit d’items. 

Tableau 2 

Exemple de calcul de la généralisabilité : plan P/CNI 2 


Facettes de différenciation 

Source Variance 

Facettes de différenciation 

Source Erreur relative Erreur relative 

P 0,0523 

C 


0,0000 


PC 

0,0000 

0,0000 


N 


0,0067 


PN 

0,0000 

0,0000 


CN 


0,0000 


PCN 

0,0000 

0,0000 


1 


0,0138 


PI 

0,0036 

0,0036 


Cl 


0,0000 


PCI 

0,0000 

0,0000 


NI 


0,0000 


PNI 

0,0137 

0,0137 


CNI 


0,0000 


PCNI 

0,0000 

0,0000 


C 


0,0000 

Variance totale 0,0523 


0,0172 

0,0378 

Coefficient de généralisabilité 3 


0,752 

0,581 


a. Le coefficient de généralisabilité est le rapport entre la variance de différenciation (variance attendue des 
scores univers) et la somme des variances de différenciation et d'erreur (variance attendue des scores 
observés). 


2 Calculs effectués au moyen du programme ETUDGEN (Dufour, 1987) 
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Le tableau 3 indique les coefficients de généraiisabilité pour plusieurs 
plans de mesure. Ces coefficients sont calculés soit à partir des composantes 
de variance d’erreur absolue, soit à partir des composantes de variance d’er¬ 
reur relative. 

Ce tableau permet d’illustrer la grande flexibilité de la théorie de la gé¬ 
néraiisabilité. En effet, alors qu’en théorie classique, le score du sujet est le 
seul objet de mesure considéré, plusieurs objets de mesure peuvent être en¬ 
visagés dans le modèle de la théorie de la généraiisabilité proposé par Cardinet 
et Tourneur (1985). En effet, le chercheur peut être intéressé non seulement 
par l’erreur de mesure sur le score des sujets, mais aussi par l’erreur de mesu¬ 
re sur le degré de difficulté de certains éléments des facettes qu’il a introduits 
dans une résolution de problème. 

Tableau 3 

Valeurs de généraiisabilité par plusieurs plans de mesure 3 


(1) 

(2) 

(3) 

Plans de mesure 

ps 

PA 

(P/CNI) 

0,752 

0,581 

(l/CNP) 

0,974 

0,832 

(N/CIP) 

0,959 

0,464 

(C/N IP) 

0,629 

0,113 

(PI/CN) 

0,718 

0,686 

(PN/CI) 

0,681 

0,595 

(N l/C P) 

0,966 

0,948 


Légende: (1) (différenciation/instrumentation) 

(2) coefficient de généraiisabilité (erreur relative) 

(3) coefficient de généraiisabilité (erreur absolue) 


Dans le cas du test Imageo5D, on peut se demander, par exemple, 
quelle est la fiabilité des niveaux de la facette I ? Jusqu’à quel point peut-on 
être assuré que la difficulté relative (l’ordre de difficulté) ou la difficulté abso¬ 
lue (le taux de réussite et d’échec dans la population) de problèmes compre¬ 
nant un nombre variable de figures indices peuvent être mesurées avec 
fiabilité par le test ? Ce type de plan de mesure requierre que nous considé¬ 
rions la facette I comme facette de différenciation (facette mesurée) et les 
autres facettes (C, N et P) comme facettes d’instrumentation décrivant l’uni¬ 
vers de généralisation. Il cherche à répondre à la question suivante : quelle est 
la fiabilité du niveau de difficulté des éléments de la facette I, peu importe le 


3 Calculs effectués au moyen du programme ETUDGEN (Dufour, 1987) 
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nombre de figures totales (N), le type de contours (C) ou encore le type de 
sujets (P) ? 

Le tableau 3 permet de répondre à la question précédente, de même 
qu’à toutes les questions similaires qui utiliseraient une autre facette ou l’in¬ 
teraction entre deux facettes comme objet de mesure. Dans ce tableau, les 
plans de mesure sont décrits selon la notation employée par Cardinet et Tour¬ 
neur (1985). À gauche de la barre oblique, figurent les facettes de différencia¬ 
tion (ou de mesure). À droite de la barre oblique, figurent les facettes 
d’instrumentation (ou de généralisation). En ce qui concerne la fiabilité de la 
difficulté des éléments de la facette I (plan I/CNP), les résultats indiquent que 
la fiabilité d’erreur relative (0,974) et la fiabilité d’erreur absolue (0,832) sont 
fort acceptables. Il n’en est pas de même pour toutes les facettes, selon le plan 
de mesure considéré. 

Les résultats du tableau 3 indiquent que l’erreur relative est moindre 
lorsque le plan de mesure considère le nombre total de figures indices 
(0,9737), le nombre total de figures (0,9594) ou encore l’interaction entre ces 
deux facettes (0,9620) comme objet de mesure ou si l’on préfère, comme va¬ 
riance de différenciation. Le classement du degré de difficulté des items en 
fonction du nombre de figures indices, du nombre total de figures ou encore 
de l’interaction entre ces deux facettes est relativement stable. Cependant, si 
le but visé est d’estimer la valeur absolue de la difficulté des items de l’univers 
de généralisation, alors seuls les coefficients de généralisabilité des plans de 
mesure (I/CNP=0,8232) et (NI/CP=0,9400) sont acceptables. Le plan de me¬ 
sure (N/CIP), même s’il permet de classer les items selon leur degré de diffi¬ 
culté avec assurance (0,9594), ne permet pas d’effectuer une mesure précise 
de la valeur absolue de la difficulté de chaque niveau de la facette «nombre 
total de figures» (0,4642). 

Le calcul des coefficients de généralisabilité du tableau 3 indique éga¬ 
lement que le degré de difficulté de chacun des niveaux de la facette 
«contours» est entaché d’une forte erreur relative (0,6293) de même que 
d’une forte erreur absolue (0,1113). Il semble que cette facette ne représente 
pas une composante suffisamment grande de la variance totale pour donner 
lieu à des effets stables qui pourraient intéresser le chercheur. Cette facette 
devrait être reformulée ou éliminée, pour être remplacée par un plus grand 
nombre de conditions d’observation d’une autre facette. 

Le tableau 3 démontre que l’instrument de mesure Imageo5D con¬ 
vient davantage à certaines situations diagnostiques qu’à d’autres. Les coeffi¬ 
cients de généralisabilité d’erreur relative indiquent clairement qu’il ne faut 
pas beaucoup de personnes, ni de nombreux niveaux des autres facettes du 
test pour démontrer que plus le nombre total de figures est élevé (N/CIP = 
0,959) ou encore plus le nombre total de figures indices est faible (I/CNP = 
0,974), plus le problème augmente en difficulté. Par contre, si l’on cherche à 
calculer le taux de difficulté dans chacune des situations précédentes, la situa¬ 
tion est toute autre. Le coefficient de généralisabilité d’erreur absolue indique 
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qu’il est beaucoup plus facile d’estimer le taux de réussite pour les trois ni¬ 
veaux de figures indices (I/CNP = 0,832) que pour les deux niveaux portant 
sur le nombre total de figures (N/CIP = 0,464). Enfin, il faudrait accroître de 
façon considérable l’échantillon de personnes ou les niveaux des autres facet¬ 
tes d’observation pour estimer de façon précise le taux de réussite dû aux con¬ 
tours (C/NIP = 0,113). 

Ceci ne sont que quelques exemples des possibilités diagnostiques qui 
s’offrent au chercheur. Celui-ci peut ainsi déterminer les conditions dans les¬ 
quelles il lui sera possible d’estimer de façon fiable, non seulement les scores 
des sujets, mais aussi le taux de difficulté pour les différentes facettes de ré¬ 
solution de problèmes pour des sujets provenant de la même population. Plus 
l’effet expérimental est fort, moins il est nécessaire d’avoir un grand échan¬ 
tillon des niveaux de facettes d’instrumentation. Par contre, lorsque l’effet ex¬ 
périmental est faible, le chercheur peut estimer à l’avance la grandeur de 
l’échantillon nécessaire de l’univers de généralisation pour estimer de façon 
précise le taux de difficulté des différentes facettes. Il n’est donc pas possible 
de parler de généralisabilité d’un instrument sans tenir compte du projet de 
mesure. Dans la pratique, le calcul des coefficients de généralisabilité pour un 
aussi grand nombre de plans de mesure n’est pas chose courante, ni même 
souhaitable. Seuls les coefficients de généralisabilité correspondant à des ob¬ 
jets de mesure bien précis ont besoin d’être calculés. En effet, le chercheur 
cherchera avant tout à optimiser les plans de mesure pour lesquels il a un in¬ 
térêt particulier. 


5. DISCUSSION 

Les résultats de l’étude de généralisabilité ont permis une analyse dé¬ 
taillée des facettes ayant servi à construire le test ImageoôD. Ils indiquent que 
les facettes «nombre total de figures» et «nombre de figures indices» consti¬ 
tuent des aspects de la résolution de problème qui sont suffisamment stables 
pour être d’intérêt diagnostique. Par contre, ils indiquent que la facette 
«contours» ne permet pas d’en arriver à des conclusions généralisables quant 
à ses effets sur la performance des sujets, quel que soit le nombre total de fi¬ 
gures en jeu ou le nombre de figures indices. 

Les résultats indiquent également que la mesure relative de la perfor¬ 
mance des sujets est généralisable, mais pas la mesure absolue. Ceci signifie 
qu’avec 12 items seulement, il n’est pas possible d’estimer avec une très gran¬ 
de précision le niveau de développement des sujets, même s’il est possible 
d’identifier avec un degré d’assurance plus élevé quels sont les sujets les plus 
avancés dans leur développement. Afin de réduire l’erreur absolue de mesure 
sur le score de chaque sujet, il faut donc accroître l’échantillonnage des items. 
Toutefois, connaissant l’importance de chaque facette en termes de compo¬ 
sante de variance totale, il est possible de distribuer cet accroissement du 
nombre d’items selon l’importance de chaque facette de l’instrument de me- 
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sure. Un examen du tableau 4 permettra d’apporter une solution plus adaptée 
à ce problème. 

La méthode la plus simple pour optimiser la mesure consiste à accroî¬ 
tre le nombre de niveaux pour les facettes d’instrumentation dont les compo¬ 
santes de variance sont les plus grandes. Pour chaque plan de mesure du 
tableau 2 (sauf le plan C/INP), le tableau 4 présente les coefficients de géné- 
ralisabilité que l’on obtiendrait si l’on doublait le nombre des niveaux des fa¬ 
cettes d’instrumentation. Cette procédure est en fait l’extension, par la 
théorie de la généralisabilité, de la formule de Spearman-Brown utilisée en 
théorie classique des tests. 

Les différents plans d’optimisation envisagés permettent de constater 
que, pour accroître la généralisabilité des scores absolus des sujets, il est pré¬ 
férable d’augmenter l’échantillonnage des questions sur la facette I plutôt que 
sur la facette N. Si l’on double le nombre de niveaux de la facette I, le coeffi¬ 
cient de généralisabilité (erreur absolue) passe de 0,581 à 0,702. Si l’on double 
le nombre de niveaux de la facette N, le même coefficient passe de 0,581 à 
0,655. Toute chose étant égale par ailleurs, il est donc préférable d’augmenter 
d’abord le nombre de niveaux de la facette I. L’augmentation du nombre de ni¬ 
veaux sur les deux facettes à la fois fournit un coefficient de généralisabilité 
(erreur absolue) encore plus acceptable (0,772). Cependant, le nombre d’ob¬ 
servations totales est passé de 576 à 2304 et le nombre d’items de 12 à 48. 

Tous ces plans d’optimisation assument que la facette C serait conser¬ 
vée telle quelle. Or, il serait possible de conserver un coefficient de générali¬ 
sabilité fort acceptable en éliminant cette facette, ce qui réduirait de 48 à 24 
le nombre d’items dans de telles conditions. L’estimation du coefficient de gé¬ 
néralisabilité pour un test de 24 items (I = 6; N = 4) est différente selon que 
l’on utilise les composantes de variance calculées à partir du groupe d’items à 
contours détaillés (CD) ou encore à partir du groupe d’items à contours non 
détaillés (CND). Dans le premier cas (CD), les coefficients de généralisabilité 
seraient de 0,830 (erreur relative) et de 0,692 (erreur absolue). Dans le se¬ 
cond cas (CND), les estimations fournissent des résultats légèrement 
supérieurs : 0,864 (erreur relative) et 0,774 (erreur absolue). Il y aurait donc 
un certain avantage à employer des items comportant uniquement des ensem¬ 
bles de figures à contours non détaillés. 

Le tableau 4 indique également comment en doublant le nombre de ni¬ 
veaux des autres facettes d’instrumentation, il est possible d’accroître la géné¬ 
ralisabilité des scores. Les changements les plus importants se produisent 
lorsque le nombre de niveaux des facettes I et N est doublé. Le tableau 5 ne 
rapporte pas de résultats pour la facette C : celle-ci ayant été fixée à deux ni¬ 
veaux, il n’est pas possible de faire d’estimation au-delà de cette valeur. 
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Tableau 4 

Généralisabilité pour différents plans d'optimisation 4 


Plan de 

mesure 



Optimisation sur (1) 



(2) 

N = 

0 

(576) 

1 

(1152) 

N 

(1152) 

P 

(1200) 

N 

(2304) 

IP 

(2400) 

NP 

(2400) 



(3) 






(P/CNI) 

0,752 

0,859 

0,834 


0,910 


_ 


0,581 

0,702 

0,655 


0,772 



(l/CNP) 

0,974 


0,985 

0,988 



0,993 


0,823 

— 

0,890 

0,842 

— 


0,908 

(N/CIP) 

0,959 

0,979 


0,980 


0.990 



0,464 

0,618 


0,479 


0,640 


(PI/CN) 

0,718 


0,836 





0,686 


0,814 





(PN/CI) 

0,681 

0,810 







0,595 

0,746 






(N l/CP) 

0,966 



0,983 





0,948 



0,974 





Légende : (1) 
( 2 ) 
(3) 
0 
F 
N 
P 
C 


facettes dont le nombre de niveaux est doublé 

nombre total d'observation 

valeur d'erreur relative et absolue 

aucun changement 

facette # indices 

facette # figures 

facette # personnes 

facette # contours 


4 Calculs effectués au moyen du programme ETUDGEN (Dufour, 1987) 
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Conclusion 

La théorie de la généralisabilité est une méthode statistique d’étude 
de la fiabilité mieux adaptée à la situation de la mesure critériée et de la me¬ 
sure en développement que les indices classiques d’estimation de la fiabilité. 
Elle permet de tenir compte d’un plus grand nombre de facettes qui affectent 
la performance des sujets et de par le principe de la symétrie des données de 
l’analyse de variance, elle permet d’estimer la fiabilité non seulement des sco¬ 
res des sujets mais aussi des niveaux de difficulté des éléments de ces facet¬ 
tes. Lors de l’optimisation de l’instrument de mesure, elle tient compte des 
facettes qui représentent les composantes de variance les plus importantes en 
fonction du projet de mesure envisagé. Dans de telles conditions, l’optimisa¬ 
tion de la mesure peut s’effectuer selon un rationel plus élaboré. Au lieu d’une 
démarche «essai-erreur» visant à créer plus d’items que nécessaires et con¬ 
sistant à éliminer par la suite les «mauvais » items, l’étude de la généralisabilité 
permet, à partir d’un échantillonnage d’items regroupés en facettes, de déter¬ 
miner les propriétés importantes de ces items dans le projet de mesure. 

La théorie de la généralisabilité constitue un outil méthodologique im¬ 
portant pour l’étude des aspects fonctionnels du développement. Pour mieux 
comprendre le fonctionnement des opérations, et incidemment leur dévelop¬ 
pement, il faut être en mesure d’étudier celles-ci dans des conditions variées 
et stables d’observation. L’étude de généralisabilité permet de déterminer 
dans quelles conditions la performance d’un individu est généralisable, ou en¬ 
core de spécifier si des effets de tâche et de contenu sont stables, peu importe 
les autres conditions (niveaux opératoires, conditions d’entrevue, etc.). 

La théorie de la généralisabilité offre beaucoup plus qu’une simple as¬ 
surance dans la mesure effectuée par le chercheur en développement. C’est 
une méthodologie de la mesure qui permet un diagnostic précis des conditions 
affectant la performance du sujet. Elle permet aussi d’améliorer les instru¬ 
ments de mesure cognitive et de mieux identifier les variables affectant le 
fonctionnement des opérations intellectuelles. Parmi les principaux avantages 
à retirer de l’étude de la généralisabilité des mesures cognitives, relevons : 

1. L’étude des composantes de variance d’interaction et des composan¬ 
tes principales renseigne le praticien et le chercheur sur l’utilité 
d’une intervention individuelle ou collective. Elle permet également 
d’identifier les facettes qui exercent l’effet expérimental le plus 
important : ce sont ces facettes qu’il faudra d’abord contrôler dans un 
dispositif d’aide au sujet. 

2. Le calcul du coefficient de généralisabilité d’erreur absolue permet 
d’estimer la précision du taux de réussite du sujet ou encore du taux 
de difficulté des différentes facettes de résolution de problèmes pour 
des échantillons de sujets tirés de la même population. L’étude d’opti¬ 
misation permet également de calculer combien de niveaux d’obser¬ 
vation de différentes facettes sont nécessaires pour obtenir la 
précision requise pour situer, par exemple, un sujet à un stade de 
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développement particulier. Tant le taux de réussite que le taux de 
difficulté doivent être estimés avec exactitude pour que le diagnosti¬ 
que soit valide. 

3. Les développements récents de la théorie de la généralisabilité (Car- 
dinet, 1994) permettent de mesurer la fiabilité du progrès individuel 
dans différentes conditions au moyen du «découpage» de facettes. 
Cardinet (1994) démontre également qu’il est possible d’estimer non 
seulement la fiabilité d’un score, mais aussi celle d’un profil de scores. 
Ces nouveaux ajouts étendent encore davantage les possibilités de 
l’étude de généralisabilité à la mesure du gain d’apprentissage en 
situation de mesures répétées ou encore dans l’établissement de pro¬ 
fils de scores individuels. 

En conclusion, l’utilisation conjointe de la mesure critériée et de la 
théorie de la généralisabilité permet de mieux mettre à profit l’information ob¬ 
tenue sur la performance d’un sujet ou d’un groupe de sujets à un test, qu’il 
s’agisse d’un taux de réussite, d’un pourcentage de difficulté ou encore d’un 
profil de scores. Le diagnostique peut, dans de telles circonstances, être plus 
fiable et plus valide. La théorie classique des scores comportait des limites sé¬ 
rieuses à cet égard et n’a eu que peu de retentissement dans la mesure opéra¬ 
toire. Les possibilités nouvelles offertes par la théorie de la généralisabilité et 
la mesure critériée devraient contribuer à renverser cette tendance. Cette ar¬ 
ticle a tenté d’illustrer quelques-unes de ces nouvelles possibilités. 
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Après avoir parcouru l’ensemble de l’ouvrage, le lecteur éprouvera 
peut-être une impression d’hétérogénéité. En fait, cet ouvrage n’a pas été con¬ 
çu comme un recueil de contributions d’auteurs défendant et illustrant une 
méthodologie ou un cadre théorique commun. Il représente au contraire un 
lieu de rencontre et de débat entre des personnes dont l’expérience du terrain 
et les références théoriques sont différentes. Il vise par conséquent à offrir au 
lecteur une diversité de réponses à une même question : que peut apporter la 
psychologie cognitive aux pratiques d’évaluation des apprentissages ? Au tra¬ 
vers des chapitres, le lecteur peut ainsi percevoir les forces et les faiblesses, 
les promesses et les limites des théories cognitivistes dans le champ de l’édu¬ 
cation et, plus particulièrement, dans celui de l’évaluation. 

Il nous a paru utile de profiter de ce court chapitre de conclusion pour 
passer en revue les différentes pratiques d’évaluation des apprentissages et 
discuter du rôle que peut y jouer la psychologie cognitive. Nous parcourrons 
ainsi une série de situations qui, chacune, fait appel à un modèle particulier de 
l’évaluation avec ses exigences et ses règles propres. Ce parcours nous per¬ 
mettra de mieux comprendre la diversité des regards et des jugements que les 
spécialistes de l’évaluation peuvent porter sur la psychologie cognitive. Dans 
certaines situations d’évaluation, il est vraisemblable que les apports de la psy¬ 
chologie cognitive resteront limités. Par contre, dans d’autres cadres évalua¬ 
tifs, la psychologie cognitive stimule déjà des changements importants dans la 
manière d’apprécier les apprentissages et d’intervenir pour développer ou mo¬ 
difier ceux-ci. 

Dans le cadre de l’évaluation certificative, la psychologie cognitive pa¬ 
raît n’avoir guère de place. En effet, la certification porte avant tout sur les 
performances et non sur les processus mis en oeuvre pour produire ces per¬ 
formances. Aujourd’hui, la préoccupation majeure des praticiens est de cons¬ 
truire des épreuves d’évaluation certificative qui soient les plus authentiques 
possibles, c’est-à-dire qui permettent de vérifier la capacité des apprenants à 
utiliser adéquatement leurs apprentissages dans des situations de vie quoti¬ 
dienne. Ainsi, l’évaluation certificative de la lecture devrait s’appuyer sur des 
épreuves fonctionnelles destinées à vérifier si l’élève est capable d’utiliser la 
lecture en situation naturelle pour atteindre un but précis. Dans une domaine 
très différent, celui de la certification professionnelle des médecins, des mé¬ 
thodes comme celle du patient standardisé (Swanson, Norman & Linn, 1995) 
ont été développées pour évaluer la capacité des étudiants à poser un diagnos¬ 
tic correct dans une situation très proche de la situation professionnelle. L’ob¬ 
jectif est ainsi de vérifier ce que le candidat médecin est capable de faire et 
non de mettre en évidence la manière dont il traite l’information qui lui est 
présentée. 

Si nous nous tournons vers l’évaluation en situation de sélection, le 
constat est assez semblable : la psychologie cognitive n’y a guère de place. Ici 
aussi, l’attention se porte avant tout sur la performance des sujets, soit en ré¬ 
férence à un critère (le sujet atteint-il le seuil de réussite fixé pour être 
admis ?), soit en référence aux performances des autres candidats (le sujets 



Conclusion 215 


se situe-t-il dans les x meilleurs qui seront admis ?). Dans ce cadre évaluatif, 
les personnes qui présentent les meilleures performances sont réputées pos¬ 
séder certaines caractéristiques cognitives souhaitées. Mais cette inférence 
reste généralement implicite et ne fait que rarement l’objet d’une analyse ap¬ 
profondie. 

Dans le cas de l’évaluation formative, les apports de la psychologie co¬ 
gnitive sont plus diversifiés. Dans un certain nombre de situations, ces apports 
restent réduits. Ainsi, lors des évaluations en début ou en cours d’apprentis¬ 
sage, de nombreux enseignants se limitent à vérifier la présence ou l’absence 
de certaines acquisitions. Leur objectif est d’obtenir des informations utiles 
pour déterminer le point de départ d’une séquence d’apprentissage ou pour 
décider s’il y a lieu ou non de continuer à exercer telle ou telle habileté. L’at¬ 
tention est alors focalisée sur la réussite des élèves et non sur leur activité 
mentale. Par contre, certains modèles didactiques encouragent une évalua¬ 
tion formative plus attentive au monde interne des élèves. Ainsi, s’appuyant 
sur de nombreuses recherches qui montrent que les enfants arrivent à l’école 
avec des connaissances substantielles à propos des relations quantitatives 
(voir Bideau, dans ce volume), certains didacticiens suggèrent d’utiliser ces 
connaissances pour fonder les apprentissages numériques et arithmétiques. 
Resnick, Bill et Lesgold (1992) encouragent, par exemple, la stimulation des 
schémas protoquantitatifs que possèdent les enfants (comparaison, croissan¬ 
ce/décroissance et partie/tout) pour amener ces derniers à construire des ver¬ 
sions quantitatives de ces schémas. Dans cette perspective didactique, des 
modalités d’évaluation doivent être imaginées pour permettre aux ensei¬ 
gnants de réaliser des inférences valides à propos des schémas que possèdent 
leurs élèves. Un constat similaire peut être fait à propos des apprentissages 
scientifiques. Pour de nombreux didacticiens des sciences, l’évaluation des 
préconceptions des élèves apparaît en effet comme une étape nécessaire pour 
permettre la construction solide de nouvelles connaissances (Juhsua & Dupin, 
1993). 

La psychologie cognitive peut également éclairer l’évaluation formati¬ 
ve via le concept de métacognition (voir Scallon et Wolfs, dans ce volume). On 
reconnaît aujourd’hui le caractère crucial de l’auto-évaluation pour la cons¬ 
truction des apprentissages. Pour apprendre, l’élève doit pouvoir non seule¬ 
ment reconnaître son ignorance mais aussi estimer la qualité de ses 
connaissances. Par exemple, avant de décider d’utiliser un dictionnaire, un 
élève doit pouvoir estimer que l’orthographe d’un mot est douteuse. S’il ne 
peux prendre du recul pour évaluer ses propres productions, il sera incapable 
de mettre en oeuvre des mécanismes d’autocorrection comme la vérification 
d’un mot au dictionnaire. Mais, pour aider les élèves à développer des procé¬ 
dures d’autocorrection, il est nécessaire de pouvoir évaluer leurs compéten¬ 
ces métacognitives. De ce point de vue, des techniques comme l’évaluation du 
degré de certitude peuvent être particulièrement utiles (Leclercq, 1975). 

La connaissance des contraintes du fonctionnement cognitif a égale¬ 
ment des prolongements dans l’évaluation formative. Ainsi, la capacité limitée 
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de la mémoire de travail et la nécessité qui en découle d’automatiser les pro¬ 
cédures de bas niveau a des implication non seulement pour l’organisation des 
apprentissages mais aussi pour la conception de procédures d’évaluation. Fis¬ 
cher (voir supra) présente un bel exemple d’une procédure d’évaluation for¬ 
mative éclairée par la connaissance des mécanismes cognitifs mis en oeuvre 
dans l’apprentissage des opérations arithmétiques élémentaires. Des procédu¬ 
res d’évaluation formative basées sur des modèles nettement plus complexes 
du fonctionnement cognitif ont été récemment implantées dans des tutoriels 
intelligents développés à l’université Carnegie Mellon dans le cadre de l’Ad- 
vance Computer Tutoring Project (Anderson, 1993). Les résultats obtenus se 
révèlent très encourageants en terme d’amélioration des apprentissages. 

S’ü est évident que la psychologie cognitive peut améliorer les prati¬ 
ques d’évaluation formative, c’est surtout dans le cadre de l’évaluation dia¬ 
gnostique qu’elle se révèle la plus fructueuse. En effet, ce type d’évaluation 
doit nécessairement déboucher sur une compréhension beaucoup plus préci¬ 
se des processus mis en jeu dans la réalisation d’une tâche. Le simple constat 
d’une difficulté d’apprentissage nous informe seulement de l’inadéquation en¬ 
tre les caractéristiques cognitives d’un élève et la séquence d’apprentissage 
qui lui a été proposée. Sur cette base, nous pouvons uniquement conclure que 
la répétition de cette séquence risque d’être inutile, et même néfaste car il est 
probable qu’elle entraînera la démotivation de l’élève. Il est donc nécessaire 
d’aller au-delà du constat d’échec et de tenter de comprendre le sens de la dif¬ 
ficulté observée. L’objectif de l’évaluation diagnostique est de mettre en évi¬ 
dence les caractéristiques cognitives des apprenants et, sur cette base, 
d’élaborer une projet d’action remédiative. 

Les procédures d’évaluation diagnostique qui ont été développées 
dans le cadre de la psychologie cognitive heurtent cependant certains prati¬ 
ciens et chercheurs par leur caractère très analytique et la nature peu authen¬ 
tique des épreuves utilisées. Par exemple, des épreuves de lecture de non 
mots sont souvent appliquées lors du diagnostic des difficultés en lecture 
(Jourdain, Zagar & Lété, dans ce volume). Ces épreuve permettent en effet 
d’évaluer la capacité de segmentation phonologique dont on connaît 
aujourd’hui le rôle essentiel pour le décodage de mots. La tâche de lecture de 
non mots est toutefois très peu naturelle. Par ailleurs, elle est issue d’une dé¬ 
composition de l’activité de lecture en un ensemble d’activités élémentaires. 
Pour ces deux raisons, elle n’apparaît pas pertinente à certains chercheurs 
inspirés par les théories de la cognition située (situated cognition). 

Pour bien saisir les tenants et les aboutissants du débat dont il est ici 
question, un bref rappel historique est nécessaire. Comme le souligne Calfee 
(1995), le behaviorisme n’a pas seulement été mis en question par les travaux 
cognitivistes sur les caractéristiques internes de l’organisme et sur les proces¬ 
sus qui s’y déroulent. D’autres chercheurs se sont intéressés au concept de sti¬ 
mulus et ont souligné les limites de sa définition par les behavioristes. Ainsi, 
pour Brown, Collins et Duguid (1989) le stimulus doit être défini en terme de 
contexte. Le contexte est l’ensemble de toutes les circonstances qui affectent 
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l’individu et qui influencent la production d’un comportement déterminé. 
Pour ces auteurs, le comportement d’un individu ne peut être compris en de¬ 
hors du contexte où il est apparu. Selon Calfee (1995), les théories de la co- 
gnition située sont complémentaires des théories cognitivistes classiques 
souvent peu soucieuses du contexte de production des comportements. Tou¬ 
tefois, dans les faits, les tensions sont parfois vives entre ces deux modèles 
théoriques. Il existe en particulier un courant radical de la cognition située en 
opposition totale avec les postulats de la psychologie cognitive. Les racines de 
ce courant radical peuvent être trouvées dans les travaux de Gibson (1979) 
sur la perception. Selon Gibson, l’information s’offre à nous dans l’environne¬ 
ment et doit simplement être saisie. Il n’est nul besoin de faire appel à un quel¬ 
conque traitement de cette information. Des notions comme «représentation 
mentale » et « opération mentale » sont dès lors superflues. Les conceptions de 
Gibson relatives à la perception ont par la suite été élargies à l’ensemble de la 
cognition humaine. Dans cette perspective, la compréhension des performan¬ 
ces cognitives d’un individu passe par la compréhension de son environne¬ 
ment. Le comportement d’une personne n’est en effet que la réponse directe 
à la situation rencontrée. Lave (1988) argumente cette conception par les ré¬ 
sultats de nombreuses recherches réalisées à propos des mathématiques uti¬ 
lisées par certains enfants et certains adultes dans leur vie quotidienne. Lave 
rapporte, par exemple, une observation faite sur des clientes de grands maga¬ 
sins. Celles-ci réussissaient 98% des opérations complexes relatives aux pro¬ 
duits à acheter (par exemple, «vaut-il mieux acheter 8 onces de yogourt à 
35 cents ou 6 onces de yogourt à 43 cents» ?). Par contre, ces mêmes per¬ 
sonnes ne réussissaient que 70% des mêmes opérations présentées de maniè¬ 
re scolaire. 

S’appuyant sur de telles observations, les tenants du courant radical 
de la cognition située défendent la relativité contextuelle de toute activité co¬ 
gnitive. Selon eux, les habiletés d’une personne ne peuvent être comprises 
qu’en référence au contexte où elles se manifestent. Par ailleurs, ces habiletés 
ne peuvent être transférées d’un contexte à l’autre et ne peuvent être éva¬ 
luées hors de leur contexte d’origine. Une telle position est à l’opposé des mo¬ 
dèles d’évaluation diagnostique d’inspiration cognitiviste. Pourtant, des 
cognitivistes comme Anderson (1995) font remarquer qu’une position média¬ 
ne est tout à fait possible et qu’elle est certainement plus respectueuse des 
faits. Pour Anderson (1993), une habileté cognitive peut être conçue comme 
une règle de production de la forme SI-ALORS : si la condition existe alors 
l’action est exécutée. Plusieurs règles de production peuvent s’organiser 
autour d’un but et former un système de production. Bien que liées à un con¬ 
texte donné lors de leur apprentissage, les règles de production ont pour ca¬ 
ractéristique de devenir de plus en plus abstraites et de pouvoir être ainsi 
appliquées à de multiples situations. Par exemple, l’enfant qui a appris à lire 
son nom en lettres majuscules imprimées peut par la suite le lire dans une in¬ 
finité de caractères et de contextes de communication. De même, l’élève qui 
a appris l’algorithme d’addition écrite peut progressivement l’utiliser pour ad- 
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ditionner une grande diversité de nombres. Petit à petit, cet élève va égale¬ 
ment lier ce système de production à d’autres systèmes de production et ainsi 
transférer cette habileté dans de nouveaux contextes. Il ne doit donc pas réap¬ 
prendre cette habileté pour chaque contexte d’utilisation. 

Ce modèle de l’apprentissage est en accord avec un des objectifs fon¬ 
damentaux de l’enseignement qui est de préparer l’élève à s’adapter à un en¬ 
vironnement en perpétuel changement. Pour cela, il est essentiel de favoriser 
l’abstraction des règles de production et leur transfert dans différents contex¬ 
tes. Dans le cadre de l’évaluation diagnostique des apprentissages, il y a dès 
lors lieu d’apprécier dans quelle mesure les apprenants transfèrent leurs ha¬ 
biletés cognitives dans une variété de contextes. Une telle évaluation n’est ni 
contextualisée ni décontextualisée; elle est «transcontextualisée» (Messik, 
1994). 

Le théorie d’Anderson, que nous venons de présenter très briève¬ 
ment, permet de surmonter de manière élégante l’opposition entre évaluation 
décontextualisée et évaluation contextualisée. Elle légitime par ailleurs une 
analyse des habiletés complexes en leurs composantes élémentaires sans tom¬ 
ber dans le réductionnisme. En ce sens, cette théorie apparaît aujourd’hui 
comme une cadre de référence prometteur pour l’évaluation diagnostique des 
apprentissages. 
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